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PREFÁCIO 


Neste volume final da série Física Básica, concluímos a apresentação da física 
clássica e abordamos à física do século XX. A concepção mantém-se fiel aos ob- 
jetivos adotados em toda a obr: 


enfatizar as idéias e princípios fundamentais. Es- 
peramos que a conclusão do projeto torne aparente a estreita unidade e interligação 
entre os diferentes volumes. 

Os capítulos 2 a 5 são dedicados à ótica. Na ótica geométrica, destaca-se a 
bela analogia ótico-mecânica de Hamilton, de grande relevância na introdução da 
física quântica e na compreensão de seu relacionamento com a física clássica. 

Os fenômenos da ótica ondulatória desempenham um papel não menos impor- 
tante na transição para a mecânica quântica, justificando um tratamento mais com- 
pleto do que é usual neste nível. Nas aplicações, foram incluídas difração de raios 
X e holografia 

O capítulo sobre polarização também mereceu destaque especial, pois é usado 
como base para a formulação dos princípios da física quântica. Em particular, a 
reflexão total frustrada ilustra os efeitos de tunelamento. 

Na introdução à relatividade restrita (capítulo 6), são discutidos cuidadosa- 
mente todos os efeitos cinemáticos da transformação de Lorentz e é dada uma bre- 
ve apresentação da dinâmica relativística. incluindo a inércia da energia. Há tam- 
bém uma introdução qualitativa à relatividade geral. 

No capítulo 7, é revisto o desenvolvimento histórico que levou à formulação 
da mecânica quântica. São introduzidas as ordens de grandeza básicas característi- 
cas da escala atômica. O acompanhamento em paralelo no laboratório. indispen- 
sável em todo o curso, é especialmente importante nesta parte. 

É nos capítulos de 8 a 10, que contêm a introdução à física quântica, que o 
tratamento mais diverge dos usuais. Em lugar de desenvolver a mecânica ondu- 
latória, fomentando a ilusão de que basta estender um pouco as idéias sobre ondas 
clássicas, enfatiza-se O caráter radical das mudanças introduzidas pela quantização. 
procurando formular os princípios de forma a servir como base correta para genera- 
lizações ulteriores. 

A formulação dos princípios da teoria quântica é inteiramente baseada no con- 
ceito de estados de polarização de fótons. que permite introduzi-los corretamente, 


V 


utilizando a intuição desenvolvida na ótica e com grande economia, a exemplo do 
que foi feito por Dirac no capítulo inicial de seu extraordinário tratado. 

A extensão à equação de Schrúdinger, no capítulo 9, torna-se natural, generali- 
zando o formalismo sem alterar os princípios básicos. As aplicações, no capítulo 


10, visam ilustrar os mais importantes efeitos quânticos e os principais tipos de 
espectros de energia encontrados, incluindo os espectros de bandas da física dos 
sólidos. 

A última seção trata da interpretação da mecânica quântica, tema em que tem 


havido importantes progressos recente: 


anto teóricos como experimentais. 

Consideramos inteiramente inútil incluir os habituais capítulos sobre física 
“moderna” (física atômica, nuclear e de partículas de altas energias), pois só po- 
dem limitar-se, neste nível, ao caráter de divulgação científica. Para a formação de 
engenheiro: 
base de física quântica aqui fornecida permite acesso a esses tópicos sem maiores 
dificuldades. 

Mesmo assim, este volume é apreciavelmente mais extenso que os anteriores. 
O material foi todo ministrado pelo autor, mais de uma vez. em um semestre, com 


ém especial, devem ser incluídos num curso independente posterior A 


seis horas de aula semanais. Em cursos mais compactos, será necessária uma se- 
leção. 

Como nos volumes anteriores, os problemas no final de cada capítulo foram 
cuidadosamente escolhidos para ilustrar e testar a compreensão da matéria. 
de problemas e um curso paralelo de laboratório são essenciais. 


„istas 


Atribui-se a Dirac a observação de que nunca se deve iniciar uma frase sem 
saber como se vai terminá-la. Se o autor tivesse pressentido, ao empreender esta 
obra, que demoraria quase vinte anos para completá-la, é possível que não a tivesse 
levado a cabo. O estímulo para fazê-lo veio principalmente dos estudantes, a quem 
ela é dedicada. Entretanto, teria sido inviável sem a compreensão e o apoio de 
minha esposa Micheline, a quem reitero todo o meu reconhecimento. 

Agradeço ainda à Fundação José Bonifácio, da Universidade Federal do Rio 


de Janeiro, pelo seu auxílio. 


Rio de Janeiro, 7 de julho de 1998 
H. Moysés Nussenzveig 
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INTRODUÇÃO 


QO que é a luz? Como se propaga? Como é gerada? 

Essas são algumas das questões fundamentais que abordaremos na primeira 
parte deste curso. 

Vamos discutir de início alguns dos aspectos mais simples da propagação da 
luz, parcialmente conhecidos desde a antigüidade, objeto da ótica geométrica. 

Os fenômenos da ótica geométrica são compatíveis com a teoria corpuscular 
da luz, da qual se costuma (erroneamente) citar Newton como principal partidário. 
A teoria rival, a teoria ondulatória da luz, teve sua primeira grande contribuição no 
ado em 1690, onde se encontra 
formulado o Princípio de Huygens, que desempenha um papel fundamental no 
tratamento da propagação de ondas. 

A “Ótica” de Newton, publicada em 1704 e revista em 1717, é uma obra ex- 
traordinária. Relata seus resultados sobre a decomposição espectral da luz branca e 
observações de efeitos ondulatórios, como os anéis de Newton, incluindo determi- 
nações precisas de comprimentos de onda. As idéias de Newton sobre a luz combi- 
navam as teorias corpuscula: o vudulatória, lembrando um pouco a atual teoria 
quântica. 

O triunfo da teoria ondulatória sobreveio no início do século passado, com os 
trabalhos de Thomas Young e Augustin Fresnel sobre os efeitos de interferência e 
difração. 

A obra de Huygens já continha uma discussão dos efeitos de dupla refração, 
relacionados com a polarização da luz, que também foram discutidos por Newton 
e depois por Fresnel, levando à conclusão de que as ondas de luz são transversais, 
e não longitudinais como as de som. 


“Tratado sobre a Luz” de Christian Huygens, publi 


Vimos no curso de eletromagnetismo (Fís. Bás. 3) que Maxwell, em 1861, após 
formular as equações básicas do campo eletromagnético, deduziu delas a existência 


2 Inrocução 


de ondas eletromagnéticas, propagando-se com a velocidade da luz, levando-o a 
inferir que a luz é uma onda eletromagnética. A confirmação experimental da teo- 
ria eletromagnética da luz resultou das experiências de Hertz, em 1888, em que 
produziu ondas eletromagnéticas (de rádio) e mostrou que tinham propriedades 
análogas às da luz. A antena dipolar que empregou constitui o modelo cláss 
mais simples do processo de geração de ondas eletromagnéticas. 


Tentativas de detectar um suporte material das ondas (o “éter”) culminaram na 
experiência de Michelson e Morley, em 1887, cujo resultado negativo, juntamente 
com outras evidências da inexistência do éter, foi uma das origens da reoria da 
relatividade restrita, formulada por Einstein em 1905, que discutiremos na segunda 
parte do curso. 

Curiosamente, foi nas experiências de Hertz, feitas para comprovar a teoria 
eletromagnética da luz, que ele observou as primeiras evidências do efeito foto- 
elétrico, que iria contribuir para o renascimento de uma teoria corpuscular. 

A luz do sol, cujo espectro contínuo foi revelado por Newton, é um exemplo 
de radiação térmica, emitida por um corpo a temperatura elevada. Foram dificul- 
dades em conciliar as leis da radiação térmica com a física clássica que levaram 
Max Planck, em 1900, a formular sua revolucionária hipótese dos quanta, a origem 
da teoria quântica. 

Em 1905, Einstein mostrou que os resultados observados no efeito fotoelé- 
trico, que também pareciam inexplicáveis pela física clássi 
cados estendendo à luz a hipótese de Planck e descrevendo-a em termos de fótons, 
com caráter corpuscular. 


podiam ser expli- 


O espectro da luz emitida por vapores atômicos, como numa lâmpada de só- 
dio, não é contínuo como o da luz solar: é um espectro de raias. Mais uma vez, a 


ca clássica não o explica, como não explica a existência de átomos. A estrutura 


atômica e o processo elementar da emissão de luz por um átomo só puderam ser 
explicados pela teoria quântica. Koi ela também que permitiu reconciliar a coexis- 
tência de aspectos corpusculares e ondulatórios da luz. 

Uma introdução à teoria quântica será dada na terceira parte deste curso. 

A ótica é atualmente uma das áreas mais ativas da físi 
à invenção de um novo tipo de fonte de luz, o laser, que data dos anos 60. Apli- 
cações importantes da luz laser são encontradas em praticamente todas as áreas da 
ciência e da tecnologia. 


em boa parte devido 


Entre as aplicações práticas mais promissoras em desenvolvimento encontram- 


se aquelas relacionadas com comunicações óticas e computação ótica. 


ÓTICA 
GEOMÉTRICA 


2.1 Propagação retilinea da luz 
Num meio homogêneo, como o ar dentro de uma sala ou o espaço inter- 
estelar, a luz se propaga em linha reta. Isso é particularmente reconhecível quando 


a fonte de luz é “puntiforme”, ou seja, de dimensões desprezíveis em confronto 


com as demais que entram na observação: um exemplo é um buraquinho de alfinete 
iluminado num anteparo opaco 


Nesse caso, um obstáculo opaco ilumina- 
do pela fonte F puntiforme projeta uma 
sombra de contornos bem nítidos, defini 


dos pela propagação retilínea (fig. 2.1). 


Analogamente, numa câmara escura (fig. 
2.2), forma-se uma imagem (invertida) de 
um objeto, representando uma forma pri- 


mitiva de aparelho fotográfico. 


Fig. 2.2 Câmara escura 


4 ó 


a geonêinca 


Um feixe cônico de luz de abertura muito pequena chama-se um pincel de 
raios luminosos, e no limite idealizado em que a abertura tende a zero tem-se um 
raio de luz, uma linha reta num meio homogêneo. Na teoria corpuscular, um raio 
representa a trajetória de um corpúsculo de luz. 


Para a teoria ondulatória, a propagação retilínea da luz parece difícil de expli- 
car, como foi observado por Newton. As ondas sonoras não têm propagação re- 
tilínca. Assim, por exemplo, ouvimos a voz de uma pessoa que fala do lado de fora 
de uma sala com a porta entreaberta mesmo quando a pessoa está fora da linha de 
visão. 

Conforme vimos no curso de acústica (Fís.Bás. 2), Huygens procurou explicar 
a propagação retilínca na teoria ondulatória através de seu célebre Princípio. Numa 
onda, temos de examinar a propagação da fase da onda. que define suas cristas e 
vales. Uma frente de onda (em 3 dimensões, é uma superfície) é o lugar geomé- 
trico de pontos que têm a mesma fase, p. €x., pertencem todos à mesma crista de 
onda. 


O Princípio de Huygens pode ter sido 
motivado pela observação de ondas na 
superfície de um tanque com água. Sabe- 


4 \ mos neste caso que uma frente de onda 
| / que atinge uma barreira em que há uma 
pequena abertura (fig. 2.3) gera ondas 
circulares do outro lado: a porção da 
frente de onda não obstruída comporta-se 
Fig. 2.3 Princípio de Huygens como uma fonte puntiforme. 


Segundo Huygens, cada ponto de uma frente de onda comporia-se como fonte 


puntiforme, gerando ondas secundárias. Num meio homogêneo, essas ondas são 


ondas esféricas com centro na fonte, propagando-se com a velocidade das ondas no 
meio. 

Dada uma frente de onda inicial, Huygens propõe uma construção geométrica 
para obter a frente de onda num instante posterior: Consideram-se todas as ondas 
secundárias emanadas de pontos da frente de onda inicial não obstruídos por obstá- 
culos. A frente de onda no instante posterior considerado é a envoltória dessas 


ondas secundárias. 


qr. A envoltória E de uma família de super- 
O e z fícies (fig. 2.4) é uma superfície que em 

Fig. 24 Envoltória cada um de seus pontos é tangente a uma 
das superfícies da família, ou seja, tangencia todas elas. A idéia básica de Huygens 
é que cada onda secundária isoladamente é demasiado fraca para produzir efeitos 


perceptíveis. Só produzem efeitos na envoltória E, porque sobre ela muitas ondas 
secundárias vizinhas se reforçam. 


Se tomarmos duas frentes de onda em 
instantes separados por dt, ou seja, E, © 
Zsa (fig. 2.5), vemos então que a onda 
secundária emanada de P é tangente à en- 
voltória em P’, ou seja, PP’ é normal à 
Fig. 2.5 Frentes de ondas nos instantes te tdt envoltória, e 


+ 
PP =vdr | (2.1) 


onde v é a velocidade da onda no meio. Podemos então identificar P P” com a 
direção do raio luminoso, ou seja, os raios são as trajetórias ortogonais das fren- 
tes de onda. 


A explica: 
gação retilínea da luz e a formaç 


de Huygens para a propa- 
o de 
sombras está ilustrada na fig. 2.6, onde a 
frente de onda AB, proveniente da fonte 
puntiforme F, incide sobre uma abertura 
num anteparo opaco. A envoltória CD do 
outro lado da abertura é gerada apenas 


pelos pontos de AB não obstruídos, e por 
isto fica limitada pelos raios extremos FC 
e FD que passam pela abertura 


Fig. 2.6 Explicação de Huygens para 
a propagação retilinea 


Embora exista penetração de ondas secundárias na região de sombra, a en- 


voltória é interrompida em C e D, e ondas secundárias sem envoltória, segundo 
Huygens, são fracas demais para serem percebidas. 


Na realidade, a luz penetra, embora muito fracamente, na região de sombra, o 
que constitui o fenômeno da difração, já descrito por Grimaldi em 1665. 

Quão fortes são os efeitos de difração depende de um parâmetro que não foi 
levado em conta por Huygens: o comprimento de onda À. As ondas descritas por ele 
não correspondem necessariamente a oscilações periódicas; ele as imaginava como 
uma série de pulsos. 

Newton não só descobriu a decomposição espectral da luz branca em suas 
componentes monocromática, como percebeu que cada cor corresponde a um com- 
primento de onda bem definido e mediu À com grande precisão: o valor que obteve 
para luz alaranjada é compatível com os resultados atuais. 

Os comprimentos de onda típicos na região visível do espectro (do vermelho 
ao violeta) são inferiores a lum = 10° mm: vão de 0,1 um (violeta) a 0,7 um 
(vermelho). Os desvios da propagação retilínea c da ótica geométrica, conforme 
veremos mais adiante, são tanto maiores quanto maiores as razões A/d, onde d re- 
presenta dimensões típicas envolvidas na propagação das ondas: tamanho de obstá- 
culos ou de orifícios, raio de curvatura de objetos ou frentes de onda, etc... 

Para luz visível e situações quotidianas, A/d é tipicamente < 10° e os desvios 
são muito pequenos. Já para ondas sonoras, os comprimentos de onda típicos são da 
ordem das dimensões macroscópicas (para a frequência sonora média da voz humana, 
v ~ 1 kHz, o período t- 10° seà=vt~3 x10 m/s x 10° s=30 cm). É por isso que 
a “acústica geométrica” não seria uma boa aproximação. 

Do ponto de vista ondulatório, a ótica geométrica é uma aproximação válida 
para comprimentos de onda muito pequenos em confronto com as dimensões tipi- 
cas envolvidas. 


2.2 Reflexão e refração 

Que acontece quando a luz passa de uma meio homogêneo a outro? Na inter- 
face entre os dois, há uma descontinuidade das propriedades materiais (do ponto de 
vista macroscópico: microscopicamente, há uma região de transição através de vá- 
rias camadas atômicas). 
Pi 


A 
e Seja X a superfície de separação entre dois 
meios transparentes 1 e 2 (p. ex., are água, 
ou água e vidro), e consideremos um raio 
de luz incidente no meio 1 sobre um ponto 
z P da interface È (fig. 2.7). 
Do ponto de vista da ótica geométrica (À 


2 e e 
Fig. 2.7 Plano de incidência << raio de curvatura em P), podemos 


substituir E, nas vizinhanças de P, pelo plano tangente TI a E no ponto P (fig. 


tudo se passa como se a interface fosse plana, dada por Il. Seja no vetor unitário 
da normal a È (e a II) em P. Chama-se plano de incidência o plano que contém o 
raio incidente P; P e a normal à. e ângulo de incidência o ângulo 6; entre P; P e n 
(fig. 2.7). 


A experiência mostra que o raio incidente 
dá origem geralmente a um raio refletido 
PP que volta para o meio 1 e forma 
com a normal o ângulo de reflexão Oy e 
a um raio refratado P P, transmitido para 


o meio 2, que forma com a direção da 
normal um ângulo 6», o ângulo de re- 
fração (fig. 2.8). 


A lei da reflexão. já conhecida na Grécia antiga, diz que o raio refletido per- 
tence ao plano de incidência, e o ângulo de reflexão é igual ao de incidência: 


[0/=0, 22 


A lei da refração, descoberta por Willebrord Snell em 1621 e reenconirada 
por Descartes em 1637, diz que o raio refratado também permanece no plano de 


send m 


| sen O, = 23) 


incidência, € 


onde 7, é uma constante que se chama índice de refração do meio 2 relativo ao 
meio l. Se nz > 1, como p. ex. ao passar do ar para a água, diz-se que o meio 2 é 
mais refringente que 1, e o raio refratado se aproxima da normal; se np < 1 (ao 
passar do vidro para a água, p. ex 
fratado se afasta da normal. 


o meio 2 é menos refringente, c o raio re- 


Convém observar que a constância do índice de refração relativo vale para luz 
monocromática: nn varia com a cor, © que constitui o fenômeno da dispersão, 
responsável pela separação das cores nas experiências de Newton com prismas. 
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geométrica 


Como se explicam as leis da reflexão e da refração nas teorias corpuscular e 


ondulatória? 


É fácil explicar a reflexão pela teoria corpuscular; se uma bola de tênis sofre 
uma reflexão elástica no solo, a componente vertical de sua velocidade se inverte, 
sem que a componente horizontal se altere, o que implica na igualdade entre o 


ângulo de reflexão e o de incidência. 


A explicação corpuscular da refração está da. 
ilustrada na fig. 2.9, adaptada da figura ER 
original de Descartes. Uma bola de tênis 
que penetra do ar na água no ponto B 
desvia-se da sua trajetória original BD 
para BI, pois perde parte da componente 
vertical de sua velocidade ao penetrar na 
água, ande se desloca com velocidade 


menor. 


Fig. 2.10 Efeito da descontinuidade normal 


send, _ v 


send, v 


A 


Em 


Fig. 29 Explicação corpuscular da refração 


Se vı e v> são as magnitudes das veloci- 
dades dos corpúsculos nos dois meios, a 


descontinuidade na interface muda a 
componente normal da velocidade 
(vm É Vin), sem alterar a componente 
tangencial (fig. 2.10): 


Va, = V3 sen6, = vp = v; sen 0, (24) 


o que dá 


(2.5) 


ou seja, a velocidade da luz deveria ser maior na água do que no ar (mo > 1). 


eee 


* Na realidade, a velocidade na água iria diminuindo, devido à viscosidade. Uma analogia mais adequada 


seria a penetração através de uma lâmina delgada, alterando apenas à componente normal. 
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O que a teoria corpuscular não explica é por que parte da luz se reflete e parte 
se refrata. Quando um corpúsculo de luz chega à interface, o que decide se ele vai 
se refletir ou se refratar? Newton tinha plena consciência dessa dificuldade, e para 
resolvê-la propôs sua teoria dos “acessos”. Os corpúsculos teriam “acessos de fácil 
reflexãs quando se refletiriam, e “acessos de fácil transmissão”, quando seriam 
refratados. Esses acessos seriam periódicos, regulados por uma onda que se propa- 


garia juntamente com o raio de luz. Essa teoria é até certo ponto reminiscente da 
atual teoria quântica da luz. 

Na teoria ondulatória, não há qualquer dificuldade para explicar a reflexão e 
transmissão parciais. Se prendermos uma à outra duas cordas de densidades dife- 
rentes, p. ex., uma onda que chega à junção é parcialmente refletida e parcialmente 
refratada, em proporções determinadas pelas “condições de contorno” na junção 
(veja Fís. Bás. 2, Probl. 5.11). 


O Princípio de Huygens permite obter fa- 
cilmente a lei da reflexão. Seja Q P; (fig. 
2.11) uma frente de onda incidente sobre 
a interface segundo o ângulo 6, (que é 
também o ângulo entre o raio incidente 


Pi P c a normal à). 

Fig. 241 Explicação ondulatória da reflexão 

O ponto P, da frente incidente atinge a interface após um tempo d/ vi, onde 
d = PiP e v, é a velocidade da onda no meio 1. Nesse instante, a onda secundária 
gerada por Q já terá atingido o ponto Q’, , com QUA = d ; a frente de onda re- 
fletida (envoltória das ondas secundárias geradas na interface) é PQ! (a figura 
mostra outro ponto de contato C com a envoltória, correspondente ao raio ABC). 

Os triângulos retângulos Q P, P e PQ“ Q são iguais, pois têm a hipotenusa QP 
comum e os catetos iguais QQ; = d = PiP. Logo, 6, = 6. 

`, 


A explicação da lei da refração é análo- 
ga. A frente de onda incidente QP; dá 
origem à frente de onda refratada Q +P, 
pela construção de Huygens (fig. 2.12). O 
tempo necessário para que a luz percorra 
a distância dı = PiP no meio 1 é o 
mesmo levado para percorrer d: 
no meio 2. Logo, se vı e v: são as veloci- 
dades de propagação das ondas nos meios 


Fig. 2.12 Explicação ondulatória da refração 
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1 c 2 respectivamente, e t é esse tempo, temos 


t=2= (2.6) 


Os triângulos retângulos Q P; P e Q Q2P dão: 
d, = QP sen6, 5 i = QP sen 0 
Logo, usando a (2.6), 


di senêy ovi oi di 
d, send, v pe j 


Comparando as (2.5) e (2.7), vemos que as predições das teorias corpuscular e 
ondulatória são inversas: segundo a teoria ondulatória, a velocidade da luz na água 
deve ser menor do que no ar. 

Em 1850. Foucault e Fizeau mediram as velocidades da luz no ar e na água, e 
mostraram que a velocidade na água é menor do que no ar, o que foi considerado 
como um argumento decisivo em favor da teoria ondulatória. 

O índice de refração n de um meio em relação ao vácuo é chamado seu índice 
de refração absoluto. Como c é a velocidade da luz no vácuo, a velocidade da luz 
num meio de índice de refração (absoluto) n é 


Alguns índices de refração absólitos para luz amarela de sódio 
(À = 5.890Á = 0,589um ): Ar: 1,000293 (condições NTP); água (20°C): 1,33; ál- 
cool etílico (20°C): 1,36; dissulfeto de carbono: 1,63; quartzo fundido: 1,46; vidros: 
variam entre 1,52 para o mais comum a perto de 2,0 para o mais pesado; dia- 
mante: 2,42. 

As (2.7) e (2.8) dão: 


a lise (2.9) 


4 


ou seja, o índice de refração relativo do meio 2 em relação ao meio 1 é o quo- 
ciente de seus índices absolutos. 

Pela (2.8), o tempo que uma frente de onda luminosa leva para percorrer uma 
distância d num meio de índice de refração n é 


(2.10) 


O produto nd do índice de refração do meio pela distância d nele percorrida 


chama-se caminho ótico associado a este percurso. 


2.3 O Princípio de Fermat 


Em 1657, Pierre de Fermat encontrou um novo método para determinar a tra- 


Jetória dos raios luminosos, baseado na sua idéia de que “a Natureza sempre atua 


pelo caminho mais curto”. O enunciado do Princípio de Fermat é: de todos os 
caminhos possíveis para ir de um ponto a outro, a luz segue aquele que é percor- 
rido no tempo mínimo. 

Como c é uma constante, decorre da (2.10) que tempo mínimo também é equi- 
valente a caminho ótico mínimo. 

Para a propagação da luz num único meio homogêneo (7 = constante), o cami- 
nho ótico mínimo também corresponde à distância mínima, ou seja, O Princípio de 
Fermat leva à propagação retilinea da luz entre dois pontos. 

Consideremos agora dois meios homogê- 
“ess diferentes, separados por uma inter- 
face plana. Qual é o caminho ótico mí- 
nimo para ir de Pı a P^ (fig. 2.13), pas- 
sando por um ponto da interface? 

Como os caminhos mais curtos para ir c 
voltar da interface são retas, o caminho 
procurado consiste num par de segmentos 


de reta, ligando P, à interface e a inter- 


1 
T 
i 
1 
1 
i 
i 
1 
p 
Hi 
1 


Era É face a P4. Por que ponto da interface de- 


EF 
B ; ve passar? 
Fig. 2.13 Princípio do Format na rofloxão 
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Seja Pi o ponto simétrico de P, com relação à interface. O ponto da interface 
procurado é então a intersecção de P; P4 com a interface (ponto P na fig. 2.13). 

Com efeito, se compararmos o caminho P, PP”, a outro, como P, Q P^, vemos 
pela figura que PP=PPePQ=P;Q.e que o caminho ótico via P equivale 
ao segmento de reta P;P', , menor do que o caminho PQ + QP’ associado a 
qualquer outro ponto Q da interface. 


Logo, o Princípio de Fermat leva à lei da reflexão. Vamos mostrar agora que 
também leva à lei de Snell (fig. 2.14). 


Para isso, consideremos os pontos P, e 
Pz e procuremos o ponto P da interface 
que minimiza o caminho ótico 


mn PP + mP Po. Seja TI o plano tangente 
à interface em P, O e Q as projeções de 
PePsobreTeRO=d,PpQ=d, 
OQ = d e OP = x, onde queremos de- 


terminar x. 


A fig. 2.14 dá 
Fig. 2.14 Princípio de Fermat na refração (IP PP;] = caminho ótico) 


[2 PP, |= m BP +m PR =n (a? ta 
j 


Para obter o mínimo, derivamos em relação a x: 


a Rod o 
[a +a- a] 


= m sen0, —n, sen 0; 


Logo, o caminho ótico mínimo é aquele que corresponde à lei da refração. O cami- 
nho “quebrado” minimiza o tempo porque aproveita melhor o caminho no meio 1, 
onde a velocidade é maior, reduzindo-o no meio 2, onde ela é menor. 

Na realidade, o Princípio de Fermat tem de ser corrigido: o caminho ótico não 
é necessariamente mínimo. No exemplo acima, a anulação da primeira derivada não 
garante que seja um mínimo: poderia ser um máximo ou ponto de inflexão. Um 
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ponto onde a primeira derivada se anula é um ponto onde a função considerada é 
estacionária com respeito a pequenas variações: 


f = fla +84) a) =  (so)8a +51 (15) (6 


Jo 


> f=) ea- (2.11) 


ou seja, os desvios de f em relação a seu valor estacionário são de segunda ordem 
no desvio 8x: o termo de 1.º ordem se anula. 

O enunciado correto do Princípio de Fermat é que o caminho ótico é esta- 
cionário em relação a peguenas variações: quando comparado com caminhos próxi- 


mos, os desvios são de 2.º ordem. 


Uma consegiiência importante do Princípio de Fermat é que, se existem diver- 
sos caminhos óticos do mesmo tipo (por exemplo, passando por um ponto qualquer 


da interface) ligando dois pontos, todos eles estacionários, cles têm de ser iguais. 


Isso sucede, em particular, se todos os raios emanados de um ponto P) são 
“focalizados” no mesmo ponto P; , que seria uma imagem perfeita de Pi. O Prin- 
cípio de Huygens leva à mesma conclusão, pois o foco é um caso limite de uma 
frente de onda, com raio de curvatura nulo, e o mesmo vale para o ponto fonte Pi. 
“frentes de onda” puntiformes deve ser 
o mesmo ao longo de todos os raios que ligam uma à outra. 


Logo, o tempo de percurso entre essas dua: 


Um caso em que isso ocorre (fig. 2.15) é 
o de uma fonte puntiforme P; situada 
num dos focos de um espelho cuja super- 


um elipsóide de revolução (ou 
uma porção dele). A imagem Pz é o outro 
foco. Com efeito, pela geometria do elip- 
sóide, a normal ñ é a bissetriz do ângulo 
entre os raios focais Q P; e Q Pz; além dis- 
to, QP, + QP: = OP, + QP: = cons- 
tante. Por ouiro lado, se a fonte de luz 
não estiver no foco do elipsóide, deixa de 
existir a focalização perfeita. 


Fig. 2.15 Elipsóide refletor 


Fiy. 2.16 Parabulóide refletor 


Se fizermos um dos focos afastar-se ao 
o, o elipsóide se transforma num para- 
bolóide, e raios paralelos ao eixo são fo- 
calizados no foco F. propriedade usada 
no telescópio refletor do Monte Palomar 
2.16). 


Podemos também usar o Princípio 


e em antenas parabólicas (fi 


dc Fermat para uma primeira discussão 
qualitativa do problema da formação de 
imagens. Suponhamos que se queira fa- 
bricar um objeto de vidro que produza 
uma imagem pelo menos aproximada- 


mente puntiforme de uma fonte puntiforme colocada diante dele. 


Fig. 247 Trajetória típica 


Ao penetrar no vidro e ao sair dele, os 
raios são desviados pela refração, de 
modo que uma trajetória típica será da 
forma P; Q Q' P: , correspondendo ao ca- 
minho ótico PQ + n QU + QP: , on- 
den > 1 é o índice de refração do vidro. 


Logo, para que todos os caminhos óticos sejam iguais, é preciso que a espes- 
sura QQ de vidro diminua à medida que o ângulo 6 com o eixo P; Pa aumenta, 


para compensar o er 


Fig. 2.18 Lente convergente 


imento das distâncias P, Q e Q'P.. 


O objeto em questão deve portanto ter 
qualitativamente a forma indicada na fig 
2.18, com a espessura máxima no eixo e 
diminuindo gradualmente à medida que 


nos afastamos dele. Acabamos de inven- 


tar uma lente convergente! Mais adiante 
discutiremos em detalhe a formação da 
imagem pela lente. 


2.4 Reflexão total 


Embora tenhamos mencionado que, ao encontrar a interface entre dois meios 
transparentes distintos, um raio de luz é parcialmente refletdo e parcialmente 
transmitido, não discutimos até aqui a divi 
fletida e transmitida: que fr: 


o da intensidade entre as partes re- 


> vai para cada uma? 

Experimentalmente, verifica-se que as porcentagens de reflexão e de transmis- 
são variam com o ângulo de incidência 6: Quando olhamos para baixo da super- 
fície de um lago em repouso, podemos ver o fundo: a maior parte da luz é transmi- 
tida, com Oy perto de 0º. Por outro lado, margens distantes são vistas refletidas na 
água como num espelho: para incidência próxima da rasante (8, = 90º), a maior 
parte da luz é refletida. Voltaremos a discutir estes efeitos ao tratar da teoria ele- 
tromagnética da luz (na Seç. 5.7, há gráficos da porcentagem de reflexão em fun- 
ção de 01). 

Consideremos agora o que acontece quando a luz passa de um meio mais re- 
fringente, como a água, para um menos Tefringente, como o ar. Neste caso, pela lei 
de Snell (2.7), 
sen8, 


a rT (2.12) 
n 


onde mn < 1 (o raio refratado se afasta mais da normal). 
Sendo np < 1 , existirá (Fig. 2.19) um 
ângulo 8. , chamado ângulo crítico, para 


o qual 


(2.13) 


Seo meio 1 é a água e o meio 2 o ar, p. 


e ex., é sen8. = 3/4 = 0,75, o que dá 
Fig. 2.9 Ângulo crítico 8 = 49º 
e É 


Que acontece se o ângulo de incidência 0, é > Oe ? Se aplicássemos a lei de 
Snell (2.12), isso daria sen6 > nn , ou seja, sen6o > 1, o que não pode ser satis- 
feito quando 6, é um ângulo real. 

A experiência mostra que, nessas condições, ocorre a reflexão total da luz in- 
cidente. A transição para a reflexão total é contínua: para By inferior a 8, , a fração 
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da luz que se reflete aumenta rapidamente à medida que 6, se aproxima de B. , 


tendendo a 100% na incidência crítica e permanecendo em 100% para 6 > B.. 


Para uma interface vidro/ar, o ângulo crítico é 6. = sen (2/3) = 41,5% € 


uma aplicação importante é o prisma de reflexão total, empregado em vários ins- 


trumentos óticos. 


Fig. 2.20 Prisma de reflexão total 


O prisma de reflexão total é um prisma 
de vidro com ângulo de abertura de 45º. 
Luz que incide perpendicularmente a uma 
face (fig. 2.20) tem @ > 6. e é total 
mente refletida, o que desvia o feixe de 
90º. 


É o índice de refração elevado do diamante (n = 2,42), juntamente com as 
facetas prismáticas talhadas em ângulos apropriados, que faz um brilhante faiscar: 


raios incidentes sobre ele em qualquer ângulo são totalmente refletidos. A refração 


e dispersão da luz emergente produzem as cores observadas. 


Fig. 221 Propagação da luz numa fibra ótica 


Outra aplicação extremamente importante 
da reflexão total é a propagação da luz 
em fibras óticas. O exemplo mais sim- 
ples seria um cilindro transparente de 
vidro: como ilustrado na fig. 2,21, para 
ângulos de incidência nas paredes supe 
riores ao ângulo crítico, a luz propaga-se 
dentro da fibra por reflexões totais suces- 


sivas. A fibra funciona como um guia de ondas para a luz, permitindo transmitila 
a grandes distâncias com perdas extremamente pequenas, o que é usado em tele- 
fonia. Fibras óticas são também usadas em vários instrumentos médico-cirúrgicos. 


2.5 Espelho plano 


Um dos elementos óticos mais simples é um espelho plano. Vejamos como se 


forma a imagem de um objeto nesse caso. 
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Para isso, basta seguir as trajetórias de 
dois raios emanados de um ponto P; do 
objeto, p. ex., PQP e POP (fig. 
2.22). Seja P, a intersecção dos prolon- 


gamentos dos raios refletidos QP% e 
ÕP’. Decorre então das leis da reflexão 


que os triângulos retângulos PıPoQ e 
P, Po Q são iguais, bem como os triângu- 
Fig. 2.22 Imagem de um ponto P4 num los retângulos Pı PoQ e Pı PoQ . Logo, 
espelho piano Pı Po = Pi Po ou seja, o ponto P; é o 
simétrico de P; em relação ao plano do 

espelho. Daí segue que os prolongamentos de iodos os raios refletidos se encon- 


tram em Pı, que é uma imagem perfeita de P,. Isso também decorre do Princípio de 
Fermat (Seç. 2.3). 


Para um observador em cuja vista pene- 
tram raios refletidos divergentes (fig. 
2.23), cles não diferem em nada de um 
feixe divergente originário de P; , de for- 


ma que a sensé 


ão visual é idêntica à que 


se teria se os raios emanassem de P. 


Diz-se então que P; é uma imagem vir- 
tual do ponto objeto P; . De modo geral, 
diz-se que uma imagem é virtual quando 


Fig. 2.23 Caráter virtual da imagem 


não há raios luminosos emanando dela: 
ela está no prolongamento de raios lumi- 


nosos. ~-~ 


Conforme vemos pela fig. 2.22, se tomarmos um sistema de coordenadas com 
origem no plano do espelho e plano (x,y) coincidente com ele, a relação entre as 
coordenadas de um ponto objeto e de seu ponto imagem é dada pela transformação 


P æy) > Pl 
(Objeto) (Imagem) 


(2.14) 


que se chama uma reflexão espacial com respeito ao plano (x,y) do espelho. 
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Essa transformação preserva o tamanho 
| x dos objetos (distâncias). A imagem da se- 
| ta vertical Ox (fig. 2.24) é O'Y, com a 
o z mesma orientação, ou seja, a imagem é 

y ereta (não invertida, como na câmara €s- 
cura). Entretanto ela inverte o sentido na 


dire 


perpendicular ao espelho 


Fig. 2.24 Caráter raverso da imagem (Oz > O'z’). Um triedro direto (dex- 
trorso) transforma-se num triedro reverso 
(sinistrorso). Diz-se por isso que a imagem é reversa: não pode ser superposta ao 


objeto através de uma rotação espacial. 


2.6 Espelho esférico 


As superfícies dos elementos que se empregam nos instrumentos óticos são 
quase exclusivamente planas ou esféricas. A razão é de ordem prátic: 


é muito 
mais fácil fabricar superfícies esféricas do que qualquer outra superfície curva: no 
processo de polimento, uma superfície esférica côncava e outra convexa de mesmo 
raio permanecem sempre em contato quando uma desliza sobre a outra. 

Vamos analisar agora a formação de imagens por superfícies curvas, come- 
cando com um espelho esférico côncavo. 


à O raio de curvatura do espelho é 


CV = R; C é seu centro de curvatura 
e V o vériice, em relação ao qual 
mediremos as distâncias (fig. 2.25). 


Consideremos um ponto objeto P no 
eixo e um raio PS que forma um ân- 
gulo 6 com o eixo e incide sobre o es- 
pelho em $, com ângulo de incidência 
8, , sendo refletido com o mesmo ân- 


Fig. 2.25 Espelho esférico côncavo 


gulo e cruzando o eixo em Q. Quere- 
mos relacionar a distância Q V = q com PV = p e com 0. 


Usando a lei dos senos no ACSP, vem: 
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No ASQP., temos Z sôP=1- (0 + 261). Logo, 


Ego E 210 
sen6, sen(0+20,) 

A partir das (2.15) e (2.16), é possível em princípio eliminar 0; e relacionar q 
com p para cada valor de 0. O resultado depende de 6, ou seja, ao contrário de 
um espelho plano, o espelho esférico não forma uma imagem perfeita de um objeto 
puntiforme P: raios incidentes com diferentes inclinações 6 cruzam o eixo em pon- 
tos Q diferentes após a reflexão. Dizemos que há aberração esférica. 

Entretanto, vamos ver que se formará uma imagem nítida se nos limitarmos a 
utilizar apenas uma pequena abertura angular do espelho (p. cx., diafragmando os 
raios). Isso restringe os raios admitidos a raios paruxiais, que formam com o eixo 
ângulos 8 (medidos em radianos) suficientemente pequenos para que possamos em- 


pregar as aproximações: 


(217 


Essa situação é geral, para todos os instrumentos óticos onde se empregam 
superfícies esféri formam imagens nítidas na aproximação paraxial, e geral- 
mente são usados nessas condições. 


Para um espelho de pequena abertura, O, também será pequeno, c as (2.15) © 
(2.16) Ticam 


po-R (8 R-4 8, _ 9768 
R 8 R 8+26, 1428 
8 


Substituindo a primeira dessas equações na segunda, vem 
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I 1 2 
+— = (2.18) 
já 


mostrando que, na aproximação paraxial, a posição de Q é independente de 6: to- 
dos os raios refletidos paraxiais convergem para o mesmo ponto Q, que é a imagem 
de P 

A distância imagem q está relacionada com a distância objeto p e com o raio 
de curvatura R do espelho pela (2.18). 

A simetria em p é q da (2.18) mostra que, se Q é a imagem de P, P é a 
imagem de Q, o que decorre da reversihilidade dos raios luminosos. 

Se fizermos p > « na (2.18), obtemos a imagem de um ponto objeto infini- 
tamente distante, que pode ser interpretado como um raio paralelo ao eixo: 


Oi f 4>jf= (2.19) 


A imagem é o foco F do espelho, situado 
a meio caminho entre o vértice e o centro 
(fig. 2.26). Reciprocamente, um objeto no 
foco tem sua imagem no infinito (raio 


Fig. 2.26 Foco de um espelho esférico paralelo ao eixo). 


A (2.18) pode portanto ser reescrita: 


+ (2.20) 


g. 
p 


onde f chama-se distância focal. Esta equação tem uma interpretação intuitiva 
muito simples. Vemos pela fig. 2.25 que, na aproximação paraxial, PS = PV. de 
modo que p é o raio de curvatura da frente de onda associada aos raios divergentes 
que partem de P, quando atingem o espelho. O inverso do raio de curvatura de uma 
superfície é chamado de curvatura dessa superfície, de forma que 1/p é a curvatura 
da frente da onda divergente que atinge o espelho, ou sua divergência. 
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O espelho transforma essa onda divergente numa onda convergente, que con- 
verge para a imagem Q, e 1/q é a convergência (curvatura) dessa frente refletida. 
O inverso da distância focal 1/f é o poder de convergência do espelho. Logo, a 
(2.20) significa que o poder de convergência do espelho deve ser suficiente para 
compensar a divergência da onda incidente e ademais produzir a convergência ne- 
cessária para a formação da imagem. 

Uma das principais aplicações de um espelho esférico é aumentar ou diminuir 
o tamanho da imagem. Para calcular esse efeito, precisamos determinar a imagem 
de um ponto objeto situado fora do eixo de simetria do espelho. 

Um procedimento simples e geral para fazer isso é o traçado de raios, utili- 
zando as propriedades do foco. 


Consideremos (fig. 2.27) o objeto vertical 
orientado PP = y (seta). O raio P'S 
paralelo ao eixo produz um raio refletido 
que passa pelo foco F. O raio P'S’ que 


passa pelo centro de curvatura C é nor- 


mal ao espelho, de forma que é refletido 
Fig. 2.27 Traçado de raios na mesma direção e em sentido oposto. A 
intersecção Q’ desses dois raios é a imagem Q’ do ponto P’ (também poderíamos ter 
tomado um raio incidente P’ F passando pelo foco, que seria refletido paralelamente 
ao eixo). 
vemos que a imagem Q Q 
Ihantes PPC e QQC di 


x é invertida (y < 0). Os triângulos seme- 


Decorre da (2.18) que a expressão entre parênteses no último membro é = 1 
Logo, o aumento lateral m do espelho é dado por 


cujo valor negativo significa que a imagem é invertida. 
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Para mostrar que se trata efetivamente de 
uma imagem do ponto P’ (na aproxima- 
ção paraxial), ou seja, que raios forman- 
do outros ângulos com o eixo também 


vão cruzar-se em Q', consideremos (fig. 


2.28) o raio PS que forma a imagem em 


Q e um raio P'S, proveniente de P’, que 
atinge o mesmo ponto S do espelho. 

O ângulo de incidência do raio P'S é 
Ə: + € (fig. 2.28), onde 8, é o ângulo de 
incidência de PS. Logo, o ângulo de re- 
Fig. 2.28 Formação da imagem flexão também é O + £. 


Na aproximação paraxial, PP” se confunde com um arco de círculo de centro 
S e abertura £; logo, no APP'S, 


Identificando esses dois resultados, obtemos novamente a expressão (2.21) do 


aumento lateral, 


Como o resultado é independente de £, ele mostra que, na aproximação para- 
xial, todos os raios que emergem de P’ produzirão raios refletidos que se cruzam 
em Q’, ou seja, Q’ é a imagem de P’. 

O espelho plano pode ser pensado como um caso limite de um espelho es- 
férico com R > œ. À (2.18) mostra que, nesse caso, q = —p, O que concorda com 
a (2.14): o sinal negativo de q significa que a imagem é virtual, e a (2.21) då m = 1: 
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como vimos, para um espelho plano, o tamanho da imagem é igual ao do objeto, e 
ela é ereta. 

No caso da fig. 2.27, a imagem é real, uma seta luminosa na posição indicada, 
visível por um observador cuja vista seja atingida pelos raios refletidos. Para um 
objeto como P P’ , situado à esquerda do centro C, a imagem é menor que o objeto 
c está entre C e F. Trocando os papéis de imagem e objeto, vemos que um objeto 
entre C e F tem imagem invertida e aumentada, situada à esquerda de C e real. 

Que acontece se o objeto estiver entre Fe V? 


Isso significa que, p < R /2 e a (2.18) 
implica então ser q < O 

Conforme mostra a fig. 2.29, a imagem 
QQ é então virtual, mas a (2.21) perma- 
nece válida, com Igl > p : a imagem é 
ereta e maior que o objeto. 


Fig. 2.29 Imagem de um objeto enire F e V 


O tratamento se estende facilmente à re- 
flexão por um espelho convexo. Deixa- 
mos ao leitor verificar que se obtêm as 
mesmas fórmulas anteriores, desde que se 
tome o raio de curvatura R como nega- 
tivo (o centro de curvatura C está à direi- 
~ta de V). P. ex., conforme mostra a fig. 
ncia foral continna sendo f = R/2 <0 


Fig. 2.30 Espelho convexo 


2.30, 0 foco F é 
E importante para evitar erros na resolução de problemas de ótica geométrica 


irtual, e a dis 


adotar uma convenção de sinais bem definida. As convenções que adotamos aqui 
são as seguintes: 

1. A luz incide da esquerda para a direita; a luz refletida viaja da direita para 
a esquerda. 

2. As distâncias objeto e imagem são medidas de P para V e Q para V, respec- 
tivamente, sendo positivas (objeto e/ou imagem reais) quando P e/ou Q estão à 
esquerda de V, e virtuais (negativas) quando à direita. 

3. A distância focal é FV (positiva para F à esquerda de V). 


24 Ótica geométrica 


4. O raio de curvatura é CV (positivo para um espelho côncavo). 
5. Distâncias verticais são positivas acima do eixo e negativas abaixo. 


2.7 Superfície refratora esférica 


Consideremos agora um par de meios transparentes homogêneos, de índices de 


refração m € nz, separados por uma superfície esférica convexa. 


As convenções adotadas agora são di- 
ferentes, com p, q c R positivos na si- 
tuação da fig. 2.31. A lei dos senos, 
aplicada aos triângulos SCP e SCQ, dá 


R -2 +R (222) 
sen® senB, 
e 
ER 
sen 8” 2-23) 
onde 9; e 0z estão ligados pela lei de Snell, 
m sen6, = 7, sen 8, (2.24) 


Novamente, eliminando 61 e 8, entre essas retações, é possível, em princípio, 
encontrar q em função de p para cada valor de 8. Dividindo membro a membro a 
(2.23) pela (2.22), vem 


G=R m sng 
p+R m seno” (2.25) 


onde usamos a lei de Snell. 

Mais uma vez, o resultado depende de 9, exceto para raios paraxiais, aos 
quais vamo-nos limitar, admitindo que, 9, 61 e 9> são todos << 1, e usando as 
aproximações (2.17). Nesse caso, a fig. 2.31 dá, com ST = A, 


sen 6 g0 h/p q (2.26) 
sen 1860 h/q p É 
e a (2.25) fica 
g=R 
= (2 
FIE (2.27) 
É fácil mostrar (verifique!) que isso 
“+ 2.28 
A (2.28) 


Para um raio incidente paralelo ao eixo 
(p > =), obtemos (fig. 2.32) um foco 
imagem F', com q = f’, 


m (mn) 


Fig. 2.82 Focos objeto é imagem = (2.29) 


A imagem se forma no infinito (raio emergente paralelo ao eixo, q > o) 
quando o objeto está no foco objeto F, com = 


ms -m) (2.30) 
f R 


Logo, temos duas distâncias focais distintas, com 


E e n) 231) 
p J F R 


Para calcular o aumento lateral m, podemos usar as propriedades dos focos e 
do raio central (gue passa pelo centro C e não é desviado), juntamente com o cará- 
ter paraxial dos raios. 


Como raios paraxiais passam perto do 
vértice V, podemos aproximar a superfí- 
cie do espelho na vizinhança de V pelo 


plano tangente ST em V (fig. 2.33). Os 
triângulos semelhantes PCP e Q'C Q dão 
então [cf.(2.27)] 


g-R mag 


a (2.32) 


No caso da fig. 2.33, m < O e a imagem é invertida. 

Sejamx e x as distâncias do objeto e da imagem respectivamente aos pontos 
focais objeto e imagem, ambas positivas na fig. 2.33, (x PF: y = FQ). Os 
triângulos semelhantes FYT e FPP’, por um lado, e F' VS e F' QQ , por outro, 
dão então: 


y x 
E T 


S 


o que dá 


F (2.33) 


Comparando os dois resultados, obtemos a fórmula de Newton 


x f (2.34) 


As convenções de sinais adotadas para a superfície refratora esférica são as 
seguintes: 


1. Luz incidente da esquerda para a direita. 
2. Distâncias objeto positivas à esquerda de V; distâncias imagem positivas à 
direita de V; valores negativos correspondem a imagem ou objeto virtuais. 
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3. Raio de curvatura positivo quando C está à direita de V (superfície con- 
vexa), negativo para superfície côncava. 

4. Distâncias verticais positivas acima do eixo. 

Com essas convenções, os resultados se gencralizam para superfícies refra- 
toras côncavas (R < 0) e para quaisquer sinais de p e q, correspondendo a uma 


grande variedade de casos possívei: 
Um caso limite interessante é o de uma interface plana (R —> œ), quando a 
(2.28) dá 


g= = o Dj (2.35) 
Ce =] 


Se m < nı . um objeto P visto em con- 
dições paraxiais parecerá estar (fig. 2.34) 
na posição da imagem virtual Q, mais 
próximo da interface por um fator m> . Se 
o meio ] é a água e 2 o ar, n2 =3/4: 
o fundo de uma piscina, visto de cima, 
parece menos profundo por esse fator. É 


por isso que um lápis mergulhado num 
| copo com água parece “quebrado”. 


Fig. 2.34 Interface refratora plana 


2.8 Lentes delgadas 


Uma lente tem duas superfícies refratoras, de raios de curvatura Rj e R , res- 
pectivamente na ordem em que são encontradas pela luz incidente, e com sinais 
definidos pela mesma regra acima (Seç. 2.7). O material da lente tem índice de 
refração mz , e só vamos considerar a situação em que os meios de ambos os lados 
da lente são idênticos. com índice de refração m. É fácil generalizar. 

Vamos discutir apenas lentes delgadas, em que a espessura máxima da lente é 
muito pequena em confronto com as demais distâncias relevantes (distâncias objeto 
e imagem, distâncias focais, raios de curvatura). 


Fig. 2.35 Lente delgada biconvexa 


Para fixar as idéias, vamos usar um diagrama (fig 
vexa, em que, pelas convenções adotadas, temos 


2.35) baseado numa lente bicon- 


R>0 . R<0 (2.36) 


mas os resultados têm validade geral. A aproximação de lente delgada significa que 
podemos referir as distâncias objeto e imagem ao ponto O (em lugar dos vértices). 

Uma forma possível de obter a relação entre p e q seria usar os resultados da 
Seção 2.7, determinando primeiro a imagem formada pela superfície anterior, que é 
real no caso da fig. 2.35, e depois tomando essa imagem como objeto (virtual no 
caso da fig. 2.35!) para a superfície posterior da lente, para calcular a imagem final 
por ela produzida (cf Probl. 2.14). 

Entretanto, vamos ilustrar a aplicação de um método diferente, baseado no 
Princípio de Fermat e na idéia apresentada no final da Seç. 2.3, impondo a con- 
dição de que o caminho ótico [PAQ], passando pelo topo da lente, tem de ser igual 
ao caminho ótico [POQ], ao longo do eixo, ou seja, a diferença de caminho ótico 
[PAQ] — [POQ] deve ser = 0. 

Essa diferença tem duas componentes. A primeira (ignorando a diferença entre 
m e m) é devida à diferença das distâncias percorridas. Com OB L AP e 
OD L AQ, a aproximação de lente delgada e raios paraxiais permite tomar 
PB ~ PO e DO ~ OQ (a fig. 2.35 está muito exagerada), de forma que esta 
primeira componente é m di + mdb. A segunda componente vem da substituição 


2.8 Lentes 
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de m por m ao longo do trajeto Vi V, (espessura da lente), e é dada por 
+ (m - m) VV =+ (m — n) (ñ + p) (fig. 2.35). Logo, o Princípio de Fer- 


mat dá 


0 = PAQ]- POQ]= 7 (4 +d,)- (n-a) G +t) 


(2.37) 


No triângulo retângulo AOP, temos, dentro das aproximações feitas, com 


AO =A. 


m 2 K 
E e 2 aa + 2 E a 
k =(p+d, f -p =2pd, di | d = T 


desprezival 


Analogamente, no triângulo AOQ, 


Notando que Cı Vi = C1 A = Ri, o triângulo retângulo AOC, dá 


N $ 


K =R -Ray aR É i 


desprezivel 


Analogamente, lembrando que R: < O, o triângulo AOC; dá 


o que dá, dividindo por nı e usando a (2.9), 


(2.38) 


(2.39) 


(2.40) 


(2.41) 
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(2.42) 


que é a equação básica das lentes delgadas, na forma gaussiana (obtida pelo ma- 
temático Karl Friedrich Gauss). O resultado só depende do índice de refração rela- 
tivo ma = m / m . A distância focal objeto f (valor de p para g > =) é igual à 
distância focal imagem f” (valor de q parap —> œ), por termos tomado índices de 
refração m idênticos dos dois lados da lente. 

Para calcular o aumenio lateral m, podemos usar as propriedades dos focos 
para traçar os raios, de forma análoga ao que foi feito na Seç. 2.7. 


Fig. 2.36 Aumento lateral 


Para a lente biconvexa, em que ambos os focos são reais, a fig 2.36 dá, por 
semelhança dos triângulos P P'O e Q Q'O, 


(2.43) 


e, indicando novamente por x e x as distâncias PF e F'Q do objeto e da imagem 
aos respectivos focos, 


(2.44) 


o que implica [cf. (2.341 
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tr =f (2.45) 
resultado devido a Newton, que é a forma newtoniana da equação das lentes del- 
gadas [cf.(2.34)]. 


Uma consegiiência importante da (2.45) é 
que, para x > 0, resultar > œ, e 
xX > Oimplicax > «o A fig. 2.37 
mostra a interpretação desses resultados, 
em termos do plano focal objeto Z, plano 
L ao eixo que passa por F, e do corres- 


pondente plano focal imagem F”: a ima- 
gem de um ponto P’ do plano # está no 
Fig. 2.37 Planos focais objeto e imagem o, na direção S Q // PO (FO = OF). 


Analogamente, um raio proveniente do œ numa direção Pı A (não // ao eixo) 
tem sua imagem Q; num ponto do plano focal F’. Para encontrar esse ponto basta 
traçar o raio P20 // Pi A, que não é desviado: sua intersecção com o plano F’ dá 
a imagem Q: (= Q>),-a. mesma para qualquer raio incidente na mesma direção 
(feixe de raios paralelos). 


Convergentes Divergentes ia 2d 
A fig. 2.38 mostra vários tipos de len- 


N ` ` | 7 tes, conforme os sinais e valores rela- 


| | tivos dos raios Rj e R. As lentes 
y ) A mais espessas no centro do que nas 
td b) (e) (d) (e) (f extremidades são convergentes; em ca- 


Fig. 2.38 Classificação das lentes: (a) Biconvexa; SO contrário, são divergentes, como 
(b) Plano-convexa; (c) Menesco positivo; decorre imediatamente do Princípio de 
(d) Bicôncava; (e) Plano-côncava; 
(f) Menisco negativo 


Fermat. 


Já vimos que, quando admitimos raios não-paraxiais. um objeto puntiforme 
não dará origem a uma imagem puntiforme, e sim a uma mancha menos nítida. 
Esse efeito, para pontos no eixo. é a aberração esférica, parte de um conjunto de 
aberrações que prejudicam a nitidez da imagem. Há várias outras que aparecem 
para pontos fora do eixo. 

Além disso, as posições das imagens nos resultados obtidos acima dependem 
dos índices de refração, que variam com a cor (comprimento de onda). Se a luz 


s2 


ser 


incidente é branca, formam-se imagens em pontos diferentes para as diferentes co- 
res que à compõem, o que constitui a aberração cromática. 

Vários artifícios são empregados para compensar ou reduzir essas aberrações: 
lentes compostas (sistema de lentes com o mesmo eixo), combinações de materiais 


diferentes, ete. 


2.9 Noções sobre instrumentos ótices 


O olho humano (fig. 2.39) contém, 
imersas em fluidos transparentes com 
índice de refração aproximadamente 
igual ao da água, uma “lente” fixa, a 


córnea (C), formada de material duro 
e transparente, e outra flexível, o cris- 
talino (L), que pode ser comprimida 
ou distendida (mudando seu foco) pelo 
músculo ciliar (M) (Este processo 


Fig. 2.39. Olho humano chama-se acomodação). A íris (T) é 
um diafragma cuja abertura, a pupila, 
se contrai ou dilata conforme a intensidade da iluminação. Num olho normal, luz 
incidente paralela é focalizada num ponto F da retina (fundo de olho) (R). Nesta 
estão as células (cones e bastonetes) que transmitem sinais ao nervo ótico (N), o 
qual está ligado ao cérebro. Para uma pessoa míope (hipermétrope), F’ cai antes 
(depois) da retina, o que se corrige usando lentes divergentes (convergentes). 

Há uma pequena região da retina, a fóvea, onde a acuidade visual é máxima, e 
geralmente procuramos girar os globos oculares para que a imagem do objeto que 
queremos “olhar” caia sobre ela. 

A acomodação do cristalino, mudando sua distância focal, permite que um 
olho normal de uma pessoa jovem possa ver com nitidez desde uma distância muito 
grande (“o”) até um ponto próximo, localizado a cerca de 15 cm do olho. A distân- 
cia dy em que a visão é mais nítida é de ~ 25 cm. Ambos variam com a idade; 


tomaremos do = 25cm. 


Para examinar um pequeno objeto, procuramos trazê-lo o mais perto possível 
dos olhos, a fim de que a imagem na retina seja a maior possível, mas, para que ela 
permaneça nítida, não podemos vir mais perto do que o ponto próximo. O tamanho 
da imagem na retina é proporcional ao ângulo visual, o ângulo subtendido no olho 
pelo tamanho y do objeto. 


E 
3 


> 


Fig. 2.40 Ângulo visual 
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Para a visão “a olho nú”, esse ângulo 
(fig. 2.40) é da ordem de 


O =3/dy (2.46) 


onde dy é a distância de visão mais nítida (do ~ 25cm) e supusemos y << do, de 


forma que tg 00 = 00. 


Fig. 2.41 Lupa 
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Se usarmos (fig. 2.41) uma lupa (lente de 
aumento), a lente convergente L, com o 
olho próximo de L e o objeto no plano 
focal F de L, a “imagem” (virtual) sub- 
tenderá um ângulo @ (raios paralelos) 
dado por 


AF (2.47) 


ou seja, o aumento angular produzido (que é também o aumento da imagem na 


retina) é 


(2.48) 


LA vantagem de colocar o objeto no plano focal é que o olho normal, quando re- 
laxado, permanece focalizado no œ]. Convém portanto usar uma lente L de distân- 
cia focal f a menor possível. Como as aberrações aumentam quando f diminui, isto 
limita o aumento máximo da lupa a valores menores que 10. Valores típicos são da 


ordem de 3 


Para obter aumentos maiores, podemos usar um microscópio composto, cuja 
forma esquemática mais simples está ilustrada na fig. 2.42. 


i 
i 
İF, 
E 
L 

TT 
1 Ob 
- 


Fig. 2.42 Microscópio composto 
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O objeto, de tamanho 
pequena distância focal fı , a objetiva, de forma a produzir, como na (2.44), uma 
imagem real invertida de tamanho y à distância x do foco imagem F; da objetiva. 
O aumento linear, dado pela (2.44), 


y, é colocado perto do foco objeto Fı de uma lente de 


= (2.49) 


é grande, porque x << fi (o objeto é colocado perto de F; ). 

A imagem y passa a funcionar como objeto real para outra lente, a ocular 
(lig. 2.42), cuja função é aumentar scu ângulo visual, funcionando como lupa. Se 
» é projetado no plano focal da ocular, de distância focal  . o aumento angular 
produzido pela ocular é dado pela (2.48): 


Me (2.50) 


e o aumento total do microscópio composto é o preduto dos dois, ou seja, é dado 
por 


F do = 25 cm 
x’ = comprimento do (251) 
tubo do microscópio 


Na prática, tanto a objetiva como a ocular são lentes compostas. bastante com- 
plicadas, projetadas de forma a minimizar as aberrações. 


Fig. 2.43 Telescópio refrator 
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A finalidade do telescópio refrator mais simples, ilustrado na fig. 2.43, é 
aumentar o ângulo visual, c por conseguinte a imagem observada, de objetos muito 
distantes (dis 


âncias astronômicas). 

A objetiva do telescópio recebe raios praticamente paralelos do objeto, focali- 
zando-os em seu plano focal imagem F. Raios vindos do objeto dentro de um cone 
de direções de abertura O produzem a imagem real A’ B’ no plano focal 7, que 
também subtende um ângulo 8 vista da objetiva; pela aproximação paraxial, 


rtf (2.52) 


onde y é o tamanho A' B’ da imagem e f a distância focal da objetiva. 

A posição da ocular é escolhida de tal forma que F também coincide com seu 
plano focal objeto, como no caso da lupa, de forma que o ângulo subiendido pela 
imagem final de A’ B’ é dado pela (2.47): 


=y / F (2.53) 


onde f’ é a distância focal da ocular. 


Decorre das (2.52) e (2.53) que o aumento angular do telescópio é 


a razão da distância focal da objetiva para a distância focal da ocular (geralmente 
(f>>f'). A imagem, nesse caso, é invertida, mas podem-se empregar diversos 
dispositivos para obter uma imagem ereta. 

Os telescópius de ubsei vatórios astiunÔmicos são usuahucute refletores. puis é 
mais fácil fabricar espelhos de grande diâmetro do que lentes de boa qualidade 
(veremos mais adiante as vantagens de uma objetiva de grande diâmetro); além 


disso, a aberração cromática é eliminada. 


2.10 Propagação num meio inomogêneo 


Até agora consideramos apenas a propagação de raios luminosos em meios 
homogêneos e os efeitos de reflexão e refração na interface entre dois meios ho- 
mogêncos diferentes. Que acontece num meio inomogênco, cujo índice de refração 
varia continuamente de um ponto a outro? [n = n(x)] 


Um exemplo de um tal meio é a atmosfera. O índice de refração de um gás 
aumenta com a densidade. Assim, na atmosfera terrestre, ele é mais elevado na 
vizinhança da superfície da Terra do que a grandes altitudes — numa escala de 


dezenas de quilômetros. 


n(z) 


b) 


Fig. 2.44 Meio inomogêneo 


Para ver o que acontece no caso mais-simples em que n varia apenas numa 
direção, que tomamos como sendo z, podemos substituir a variação contínua de n 
por uma “escada” [fig. 2.44(a)]. ou seja, por um meio estratificado, em que n varia 
apenas de camada para camada: no limite em que a espessura das camadas —> 0, 
reproduzimos a variação contínua. 

Aplicando a lei da refração a cada interface, teríamos [fig. 2.44(b)] 


n, sen 8, = n, sen 8, 


ou seja, -o ângulo O entre o raio e a direção z vai variando, e no limite podemos 


escrever 


| nsen 6 = constante 


que leva a uma variação contínua de 6 com n: num meio inomogêneo, os raios 
luminosos são curvos. Se n decresce de baixo para cima, eles se encurvam como na 
fig. 2.44(b); se n cresce [como na fig. 2.44(a)] , a curvatura seria em sentido 
oposto, aproximando-se da normal. 


xs Posição A situação em que n decresce com a alti- 
Š aparente 7 


` tude ocorre, na escala astronômica, com a 


atmosfera terrestre, como vimos. Assim, 
os raios luminosos provenientes de uma 
E estrela próxima do horizonte são desvia- 
dos de = 0,5º durante a penetração na at- 
mosfera (fig. 2.45). Como estamos acos- 


tumados com a propagação retilínea, ex- 


Fig. 2.45 Posição aparente de uma estrela 


trapolamos a direção em que a luz nos 


chega, “vend 
teal. 


a estrela numa posição aparente 0,5° mais elevada do que a posição 


Como o diâmetro angular aparente do Sol visto da Terra é = 0,5º, “vemos” o 


Sol, pela mesma razão, com seu dis 


logo acima do horizonte, quando nasce ou se 


: é quando ele está, justamente, logo abaixo do horizonte. 


Num dia muito quente. em que camadas 
de ar junto do asfalto 


io mais quentes 


do que as gue ficam acima, n cresce com 


a altitude e os raios se encurvam em sen- 
tido oposto, fazendo-nos ver simul- 
tancamente (fig. 2.46) luz vinda dire- 
tamente de um carro e luz “refletida” pelo asfalto, como se ele fosse a superfície 
de um lago. Essa é também a origem das miragens num deserto. 


Fig. 2.48 Miragem 


Dado n como função da posição, pode- 
mos generalizar a (2.55) estratificando o 
meio através de superfícies n = cons- 


z> 
c> 


naei tante, com valores próximos umas das 


$ outras. O ângulo 9 é então o ângulo entre 
ae 5 RE k A mp 
ss a direção ù do raio ( = vetor unitário da 
/ tangente ao raio) e a direção de N , vetor 
i unitário da normal à superfície n = cons- 
Fig. 2.47 Vetores unitários tante, e a fig. 2.47 dá 


sen = û- Ê 
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ad A s E N V PE É A ` TES 
onde T é um vetor unitário [no plano de incidência (N.u)] tangente à superfície 
a 
n = constante. A generalização da (2.55) é então 


Ara) Ê = 0 | (A = variação ao longo do raio) (2.56) 


Partindo de um ponto inicial Po e de uma direção inicial do raio tù , podemos então 
ir traçando a trajetória do raio no meio, com o auxílio da (2.56). 

Vamos ver que é possível obter uma equação diferencial para o raio, tomando 
como parâmetro o arco de curva s descrito ao longo do raio (comprimento do arco) 
a partir de uma dada origem. A equação da curva. x = x(s). chama-se equação 


intrínseca. 


j ds 


o 
Fig. 2.48 Deslocamento dx ao longo de um raio 


= 
1l 
|S 
x 
paa 
E 
x 
[i 
a 
e 
3 
b 
3 


Partimos da identidade 


(a) =r (2.58) 
e diferenciamos ambos os membros, obtendo 
(rã) dfaû)=ndn | ü- daû)j=adn 


Se dn é a variação de n para um deslocamento dx ao longo do raio. temos, 
pela definição do gradiente, 


dn = gredn dx = gradn TE ds= å- godnds 
s 


= Numa superfície de descontinuidade entre dois meios 1 e 2. temos 


a a 


e a (2.56) é equivalente à lei de Snell, pois T - à; 
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e, substituindo na equação acima, vem 
s atj g 
e E gradn (2.59) 
s 


O vetor grad n é, como sabemos, perpendicular às superfícies a = constante, 


on seja, é 11 Å (fig. 2.47). Mas o mesmo vale para d (n ù) / ds, pois, pela (2.56), 
n ü só pode mudar ao longo de Ñ (não muda na direção tangencial È ). Logo, 


decompondo à nas direções Ñ e Î, vemos que a (2.59) equivale a 


d f dx 
-2 fa =). gradn (2.60) 


que se chama de equação diferencial dos raios. 


Em particular, num meio homogêneo, onde n = constante (~. gradn = 0), a 


(2.60) fica 
dê x 
=1=0 (2.61) 
ds 
cuja solução geral é 
x=as+b 


onde a c b são vetores constantes: 


(direção inicial do raio) 


q 
(2.62) 


b =x (posição inicial) 


Recuperamos assim a propagação retilínea num meio homogêneo. 


2.11 A analogia é 
William Rowan Hamilton descobriu uma analogia extremamente bo- 


Em 1831, 
nita entre a ótica geométrica e a mecânica clássica. Foi com base nessa analogia 


que ele reformulou as leis da mecânica clássica em termos das equações de Hamilton, 
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que são discutidas em cursos de mecânica analítica; a equação de Hamilton-Jacobi, 
geralmente apresentada nesses cursos de forma muito abstrata, tem uma interpre- 
tação física muito simples e intuitiva quando formulada em termos dessa analogia. 
A analogia compara a trajetória segundo a ótica geométrica de um raio lumi- 
noso num meio inomogêneo, de índice de refração n (x), com a trajetória de uma 
partícula num campo de forças conservativas, de acordo com as leis da mecânica 
clássica. A motivação estava relacionada com a teoria corpuscular da luz; já vimos, 
p. ex., na interpretação corpuscular da reflexão e da refração, que os desvios da 
direção de propagação nestes casos são atribuídos a forças que atuam sobre os 
corpúsculos na interface entre dois meios. 
Num meio ótico inomogêneo, como vimo: 
fica determinada quando damos sua posição inicial xo e sua direção inicial, de- 
finida pelo vetor unitário da, tangente ao raio em xo. Na mecânica clássica, para 


a trajetória de um raio luminoso 


uma partícula de massa m num campo de forças conservativo em que a energia 
potencial é V(x), não basta dar xo e a direção inicial to do movimento: é preciso 
dar a velocidade inicial vo = vo o, que contém, como informação adicional, a mag- 
nitude vo da velocidade. 

Entretanto, sc a energia total E da partícula for fixada, vo fica totalmente de- 
terminada pela posição inicial xo. Com efeito, a conservação da energia dá 


lp? Ne 
Es EVG) =E = m vila) + VG) (2.63) 


onde p = m v é o momento linear da partícula. A (2.63) dá então 


vol = JÈ E -vé = rt) een 


ou seja, a magnitude vo da velocidade em cada ponto x fica inteiramente determi- 


ý n gi ura A PR + 
nada para E dado; só resta arbitrar a direção inicial W da trajetória, como no caso 


dos raios luminosos. 


“Temos então, em cada ponto x, um valor bem definido da magnitude p (x) do 
momento lincar de uma partícula que passe por esse ponto: 


p()=mv()=2m [E-v6)] (2.65) 
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Seja x =x(s) a equação paramérica de uma trajetória, em função do arco de 
curva s ao longo da trajetória. Se s = s (1) é a lei horária do movimento ao longo 
da trajetória, temos então ds/dt = v, e 


dx dx ds dx 
= = RE 
ds 


v= = 
dt ds dt 


=vê (2.66) 


A e nia ; š siara 
onde u, vetor unitário na direção da velocidade, é tangente à trajetória. 
Para determinar a trajetória, aplicamos a 2.º lei de Newton: 


DE =F=-gadv (2.67) 
onde 


(2.68) 


A i A 
dp_dpds_ dP p iY p ea 
dt dsdt “ds ds “asPas) 


em que foi usada a (2.66). 
Por outro lado, a (2.65) dá, pela regra da cadeia, 


-172 
grad p = se grad V = -fam [z z vÆ] grad V =- 7 grady (2.69) 
p 


s. gad V = Z grad p = v grad p (2.70) 


Substituindo a (2.68) e a (2.70) na (2.67), obtemos finalmente a equação dife- 
rencial das trajetórias: 


d dx 
Sã, — | = gra 2.1 
EE Ro 2 grad p (x) (2.71) 


que tem exatamente a mesma forma que a equação diferencial dos raios na ótica 
geométrica, com n (x) substituído por p (x) [cf.(2.60)]. Como n (x) é um número 
(adimensional), para completar a analogia basta dividir os dois membros da (2.71) 
pela constante 
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po="2mE e 


que é o momento de uma partícula livre de energia E, definindo: 


i 
io- Sn | OO (2.13) 
Po E 
que é real para E > V(x) (região acessível ao movimento). 
A (2.71) dá então 
alt w =] =gradn (2.74) 


que é exatamente a equação diferencial dos raios, (2.60). 
Logo, a trajetória clássica de uma partícula de energia E num campo de 
forças de energia potencial V (x) é idêntica à trajetória de um raio luminoso num 
meio inomogêneo de índice de refração dado pela (2.73), de acordo com as leis da 
ótica geométrica. Essa é analogia ótico-mecânica descoberta por Hamilton. 
Exemplo: Consideremos o movimento de uma partícula no campo gravi- 
tacional uniforme próximo à superfície da Terra, para o qual 


V=mgz 
tomando origem no solo (z = 0). Seja 
=mgh 


(h = altura máxima atingível pela partícula). Temos então, pela (2.73), 


n= h 


que diminui quando z aumenta, como na fig. 2.44(b). 
Se tomarmos a origem como ponto inicial da trajetória, com à, no plano (x.z), 


B=(0,.B) (0 > Bo = cosenos diretores) 


a trajetória permanece nesse plano, e a componente x da (2.74) fica 


dx 
n—— = constante = 
ds d 


0, (dx / dS) = Wi: = Ww, en(z = 0) = 1. Logo 


Como (dx) + (dz) = (dsř , isto dá 


dz 


ds \ 


onde o sinal decorre de (dz/ ds) = w: =. 


Dividindo membro a membro uma dessas relações pela outra, vem 


Integrando ambos os membros entre (0,0) e (xz), vem 


x 
— = 2h 


o 


e, resolvendo em relação a z, 


Fig. 249 Trajetória parabólica 
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equação da parábola (fig. 2.49) que passa pela origem, com direção inicial 
h = ( Œo, Bo) no plano (x,z), que é a trajetória prevista pela mecânica clássica para 
a velocidade inicial vo h = \ 2E/m (0o, Bo) (verifique!) 

Uma das aplicações importantes da analogia ótico-mecânica é a ótica eletrô- 
nica, ou, mais geralmente, a ótica de feixes de partículas. Trata-se de manipular um 
feixe de partículas, tratado pela mecânica clássica, como se fosse um feixe de luz 
na aproximação de ótica geométrica, usando campos de forças para desviar ou fo- 
calizar o feixe, construindo elementos análogos a espelhos, prismas, lentes, etc.. 

No caso dos elétrons, por exemplo, podem ser usados campos eletrostáticos 
para esse fim. Um campo elétrico uniforme entre placas paralelas, que produz uma 
trajetória parabólica, como vimos no exemplo acima, é usado para desviar um feixe 
de elétrons, funcionando como um prisma na ótica, Isso se [az uum lubo de os- 
ciloscópio ou de TV, por exemplo. 


Um exemplo de úma lente eletrostática 
(fig. 2.50) é uma placa com um pequeno 
orifício circular, com uma diferença de 
potencial em relação a outra placa dis- 
tante. As superfícies equipotenciais (fig. 
2.50) formam protuberâncias para fora do 
orifício, e a força F sobre um elétron 
num ponto P tem uma componente radial 
que aponta para o eixo, exercendo um 
efeito de focalização. Lentes análogas a 


Fig. 2.50 Lente eletrostática; I.f. = linha de força =” Es è 
essa são empregadas no microscópio ele- 


trônico, que permite obter aumentos muito mais elevados do que um microscópio 
ótico, por razões que serão discutidas mais adiante (Seç. 4.8). 

Existem também lentes magnéticas para partículas carregadas. A focalização 
desempenha um papel importante para os feixes de aceleradores de partículas. 

A analogia ótica-mecânica também teve um papel fundamental na formulação 
da mecânica quântica, conforme veremos. 

Observações: 

Na ótica geométrica, como vimos, o caminho ótico entre dois pontos Po e P, é 
estacionário, ou seja, 


f E E: 1 
| Princípio de Fermat: 8 f'n ds=0 | 
l BA 
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Pela analogia ótico-mecânica, o análogo dessa propriedade para trajetórias na 
mecânica clássica é 


pR 
Princípio de Maupertuis: Ô J pas =0 


Uma vez obtida a trajetória, a lei horária sobre ela resulta da relação 


: basta integrar 


PROBLEMAS 


1. O ângulo de incidência 6, para o qual o raio refletido é perpendicular ao 
raio refratado chama-se ângulo de Brewster. (a) Obtenha o ângulo de Brewster 
914 em função do índice de refração relativo n do meio 2 em relação ao meio 1; 
(b) Calcule 0,» para as seguintes interfaces: ar/água; ar/vidro comum. 


2. Num galvanômetro sensível, a deflexão do fio de torção produzida pelo 
campo magnético da corrente é medida pela deflexão de um feixe de luz refletido 
por um pequeno espelho plano preso ao fio. Se o espelho gira de um ângulo 0, de 
quanto gira o feixe de luz refletido? 


3. Quantas imagens de uma fonte puntiforme situada entre dois espelhos que 
formam entre si um ângulo 6 = 90º são produzidas? E se O for = 120º? Generalize 
para O = 27/7, com n inteiro. 


4. Uma pessoa tem 1,75 m de altura, e a distância de seus olhos ao solo é de 
1.60 m. Para que ela possa ver a sua imagem completa num espelho plano de porta 
de armário: (a) qual deve ser a a altura mínima do espelho? (b) a que distância do 
chão deve estar a borda inferior do espelho? 


5. Uma lâmina de vidro de faces planas paralelas tem um índice de refração 
n e espessura h. Um raio de luz incide sobre ela com ângulo de incidência 6:. 
Mostre que o raio transmitido através da lâmina é paralelo ao raio incidente. A 
distância perpendicular d entre o raio transmitido e o prolongamento do raio inci- 


dente chama-se desvio lateral. Calcule d em função de n, he & 


6. Considere um prisma de ângulo de 
abertura œ e um raio incidente sobre uma 
face com ângulo de incidência Qi: seja n 
o índice de refração do prisma. Chama-se 
desvio 8 o ângulo entre as direções do 
raio emergente e do raio incidente (fig.). 
Mostre que, para pequenos ângulos de 
abertura (o. << 1) e pequenos ângulos de 
incidência (8, << 1), o desvio é independente de 6, e é dado por ô=(n- Do. 


7. Relacione ô no Probl. 6 com n e 8; no caso geral (sem supor & e 8; pe- 
quenos), e mostre que 3 é mínimo quando o ângulo de emergência 6 (fig. acima) 


é igual a 6,. Mostre que, quando isso acontece, vale a relação 


onde ô é o ângulo de desvio mínimo. Essa relação é empregada para medições 
precisas do índice de refração n. 


8. Quando um raio de sol penetra numa 
gota de água, ele sofre reflexões múl- 
tiplas internas acompanhadas de trans- 
missões parciais para fora. Considere 
um raio ABCDE que sofre uma única 
reflexão interna antes de emergir da 
gota (fig.). (a) Mostre que o desvio 6 
do raio emergente DE em relação à di- 
reção de incidência AB é dado por 


6=n+26,-48, 


onde 62 é o ângulo de refração associado ao ângulo de incidência 8, (trate a gota 
como uma esfera de índice de refração n). O arco- 


is primário se forma quando o 
desvio 8 é mínimo. (b) Mostre que isso acontece para um ângulo de incidência 
Or tal que 


=“ à 


sen O = 4 


(c) Calcule o ângulo 8 correspondente (ângulo do arco-íris primário) para luz ama- 
rela. 


9. No modelo simplificado de fibra ótica 
discutido na Seç. 2.4 (cilindro circular de 
vidro), calcule o ângulo de incidência 6 


máximo na face de entrada (fig.) para o 
qual a luz será guiada dentro da fibra por 
reflexões totais sucessivas, em função do 
índice de refração n da fibra. 


10. Repita a dedução vista na Seç. 2.6 para um espelho esférico convexo, 
mostrando que se obtém a mesma relação distância-imagem (2.18), mas com R < 0, 
Mostre que a expressão (2.21) do aumento lateral também permanece válida nesse 
caso. 


li. Para um espelho esférico, também podemos tomar a origem no foco F, 
em lugar do vértice do espelho. Sejam PF = x e QF = x as distâncias objeto e 
imagem, respectivamente, referidas ao foco. Demonstre a fórmula de Newton 
xx =f’ (ef. (2.34)]. 


12. Justifique os seguintes métodos rápidos para determinar se um espelho 
O é côncavo ou convexo: (a) Olhando para a própria imagem desde um ponto 


esi 
próximo ao espelho: se a imagem é aumentada, o espelho é côncavo; se é dimi- 
nuída, é convexo. (b) Olhando de uma grande distância: se a imagem é invertida, o 


espelho é côncavo; se é ereta, é convexo. 
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13. Repita a dedução da Seç. 2.7 para uma superfície refratora esférica côn- 
cava, mostrando que a (2.28) permanece válida (com R < 0), bem como a última 
expressão na (2.32) para o aumento lateral. 


14. A partir da (2.20), trace um gráfico de (q/f) em função de (p/f), to- 
mando para (p/f) os pontos £0,5,+1,0,+1,5,+2.0 e +3,0. Para cada um desses 
pontos calcule o aumento lateral. Interprete os resultados em termos de objetos 
reais ou virtuais, imagens reais/virtuais, eretas ou invertidas, para cada um dos pon- 
tos acima, fazendo o traçado de raios correspondente, (a) para um espelho côncavo: 
(b) para um espelho convexo. 

15. O diâmetro médio da Lua é = 3,48 x 10º km c a distância Terra-Lua é 
=3,82 x 10º km. Se empregarmos um telescópio refletor esférico de 5 m de diã- 
metro para observar a Lua, qual será o diâmetro.da imagem da Lua vista pelo 
telescópio? 


16. Deduza a equação (2.42) para uma lente delgada construindo a imagem 
por duas refrações sucessivas, nas superfícies esféricas dianteira e traseira da 
lente. 


17. Deseja-se projetar um espelho de toalete côncavo que aumente a imagem 
2 vez para jovens de visão normal. com distância de visão mais nítida 


dı = 25 em. (a) Qual deve ser o raio de curvatura? (b) Qual é a distância ideal de 


uso? 


18. Um espelho esténco tem distância focal f. Ache duas posições de um 


objeto para as quai 
objeto. Discuta todos os ca: 
vexo e a imagem (objeto) seja real ou virtual; em cada caso, desenhe o traçado de 
raios mostrando as posições de objeto e imagem em relação ao vértice e ao foco do 
espelho. 


o tamanho da imagem é A vezes maior que o tamanho do 


DS possíveis, conforme o espelho seja côncavo ou con- 


19. O raio de curvatura de uma lente plano-côncava de vidro (n = 1,5) é de 
0,5 m. Calcule sua distância focal (a) no ar; (b) quando imersa num líquido 
(S2C ) de índice de refração absoluto 1,63. Comente o resultado, 
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20. Sem fazer a aproximação paraxial, calcule a distância q da “imagem” pro- 
duzida por uma superfície refratora esférica convexa de raio de curvatura R para 
um raio incidente paralelo ao eixo, em função do índice de refração relativo np e 
do ângulo de incidência 94. Mostre que o resultado depende de 0,, mas, na aproxi- 
mação paraxial, reduz-se à distância focal imagem. independente de 6. 


21. Uma lente delgada convergente de distância focal f é colocada entre um 
objeto e um anteparo fixos, a uma distância d > 4f um do outro. Desloca-se a lente 
até que ela forme uma imagem da do objeto no anteparo. (a) Mostre que exis- 
tem duas posições diferentes da lente para as quais isso acontece. (b) Sejam y e 
ões. Demonstre que 


y” os tamanhos da imagem correspondentes a essas duas po: 


o tamanho do objeto é a média geométrica de y e y”. 


22. Demonstre que a distância focal de uma lente delgada biconvexa pode ser 
expressa em função do diâmetro D da lente, de sua espessura 1 e do seu índice de 
refração ny relativo ao meio. 


23. Obtenha a equação das lentes delgadas para uma lente de índice de re- 
fração nz situada entre dois meios de índices z; e m. Verifique que o resultado se 
reduz ao que foi obtido, quando m = n5. 


24. Chama-se potência P de uma lente, o inverso de sua distância focal f (se 
ffor medida em m, P se mede em diopírias). Considere duas lentes delgadas de 
potências P, e P2 em contato uma com a outra. Mostre que equivalem a uma única 
lente de potência P = P, + P, (soma algébrica). 


25. Se dermos um pequeno deslocamento Ap à posição de um objeto, ao 
longo do eixo de uma lente delgada, a imagem desse objeto se desloca de Ag. A 
razão Ag / Ap chama-se aumento longitudinal. Demonstre que 


Ag/Ap=-m 


onde m é o aumento lateral: podemos considerar A q como a imagem de um pe- 
queno objeto situado ao longo do eixo. Se esse objeto é uma seta, a imagem aponta 
no mesmo sentido ou em sentido oposto? 
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26. O índice de refração de um meio inomogêneo, em função da altitude z, é 
dado porn = m + nz. onde no e x são constantes. Um raio luminoso no plano (x 
z) parte da origem numa direção de cosenos diretores (Gy, Bo). Obtenha a equação 


da trajetória desse raio. 


27. Uma esfera transparente de índice de 
refração n, espelhada numa calota AB da 
sua superfície, com centro em C (fig.), é 
usada como reiro-refletor: qualquer raio 
1 paralelo ao eixo CD e paraxial (próxi- 
mo ao eixo) é refletido em C e volta em 
sentido inverso (raio 2, fig.) 


Calcule o índice n. 


28. Uma lente delgada biconvexa tem distância focal f. (a) Demonstre que a 
distância mínima entre um objeto e sua imagem real é igual a 4f. Para que distân- 
cia p do objeto à lente esse mínimo é atingido? (b) Qual é o aumento lateral na 
situação do mínimo? (c) Desenhe o traçado de raios correspondente à situação do 


mínimo, tomando como objeto uma seta perpendicular ao eixo. 


INTERFERÊNCIA 


3.1 interferência de ondas 


Ulm experimento fundamental para demonstrar a natureza ondulatória da luz 
foi realizado em 1801 por Thomas Young. Young, formado em medicina, deu con- 
tribuições fundamentais à teoria da elasticidade (módulo de Young). à anatomia 
(mecanismo da acomodação no olho) c à cgiptologia (ajudou a decifrar a pedra de 


Roseta), além das suas contribuições à ótica. 


Um efeito caracteristicamente ondulatório, encontrado quando ondas se super- 
Bás. 2, 
cap. 6). Foi Young quem primeiro chamou a atenção para esse efeito, dando o 
exemplo de dois conjuntos de ondas na água que chegam juntos a um canal estrei- 


to, observando: “se entrarem no canal de tal forma que as ele 


põem, é o efeito de interferência, que já discutimos para ondas sonoras (Fí. 


des de um coin- 


cidem com as do outro, produzirão como resultado elevações maiores; mas se as 
elevações de um coincidem com as depressões do outro, preencherão exatamente 
essas depressões. e a superfície da água permanecerá em repouso. Afirmo agora 
que resultados semelhantes ocorrem quando duas porções de luz se juntam, e é o 
que chamo a lei geral da interferência da luz”. 


Para demonstrar esse efeito, Young usou 
uma fonte puntiforme de luz F (fig. 3.1) 
para iluminar um anteparo opaco 4 onde 
havia dois buraquinhos de alfinete Pı e Pz 
muito próximos entre si, e observou o re- 
sultado sobre outro anteparo O, cada pon- 
to P do qual é atingido por dois caminhos 
diferentes 1 (P,P) e 2 (P>P). Em lugar 
do resultado ser a soma das iluminações 


Fig. 31 Experimento de Young 
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dos dois orifícios, apareciam franjas brilhantes e escuras, as franjas de interferên- 
cia. 

Para analisar efeitos como esse, precisamos de uma representação do sinal lu- 
minoso. Vimos no curso de eletrromagnetismo que a luz é uma onda eletromag- 
nética, descrita através dos campos E e B. Entretanto, para entender os efeitos de 
levar em 
conta o seu caráter vetorial. Simplifica muito o tratamento empregar, como fare- 


interferência e difração da luz, não é necessário, na maior parte dos c 


SO! 


mos, uma função de onda escalar E(x.t), que poderia scr pensada como um aná- 
logo escalar do campo elétrico da onda. Discutiremos a ótica eletromagnética no 
Cap. 5. 

As experiências de interferência mais simples são feitas com luz monocromá- 
tica (p. ex., luz amarela de vapor de sódio), correspondendo a uma frequência an- 
gular de oscilação œ fixa. Para simplificar a análise de oscilações harmônicas, con- 
vém adotar, como sempre temos feito (Fís.Bás. 2 e 3), a notação complexa, escre- 


e) [roe ] 


Na representação de uma onda plana, p. ex., 


vendo 


vE) Ad? e f El)-Acos(k-x-01+5)) 63 


A =amplitude (real) da onda (A e Ta amplitude complexa) 
y(x,f)=k-. x- ©ż+ ô= fase daonda 


k = kù = vetor de onda ; k n 


a v = velocidade de fase 
e n = índice de refração 


2x E 
k = 2 Ê número deonda ; À = comprimento de onda no meio 
2 ha T carers detnanreizias 
@=2nv=4 ; v=freqüência ; T=período | "= p, "USTO de onda reduz: 


T 


= comprimento de onda no vácuo 


Ñ = versor da direção de propagação 


ô = constante de fase. 


k As frentes de onda (superfícies de fase 
a E ú 
wy = constante) são planos perpendiculares 
=g” . 
| a à direção do vetor de onda k (fig. 3.2). 


Fig. 3.2 Onda plana 


Analogamente, para uma onda esférica, proveniente de uma fonte puntiforme, 
como o oscilador de Hertz (Fís. Bás. 3), 


va)= Ae. 


> E (x,t) = Ácos(tr-0:+8) 
7 


Fig. 3.3 Onda esférica (3.4) 


onde r = | xl. 


A amplitude cai com (1/ r), e as frentes de onda são esferas r = constante (fig. 


w 
2 


Como relacionamos a intensidade da luz com a função de onda associada 
E(x,1)? A intensidade está relacionada com a energia por unidade de tempo e de 
área que atravessa um elemento de área perpendicular à direção de propagação (cf. 
Fís. Bás. 3). 

Para uma onda monocromática, o valor instantâneo da intensidade oscila 
no tempo, numa dada posição x, como cos (mi + 0), onde O é uma constante 


[cf.(3.3), (3.4)]. Para luz visível, 
ati / (o © ~ 102s57!, essa oscilação é tão rápida 
2| / que um detetor só registra o valor médio 
0 


temporal, com (fig. 3.4) 


Fig. 3.4 Valor médio 


valores médios 
X 


K 
E cos (@r +a) = < ser (0t +a) >= 
l 


| 
| (3.5) 
2 

Por conseguinte, podemos dizer que o valor médio da intensidade é propor- 
cional a 


=|] (3.6) 


que é constante para uma onda plana e cai com o inverso do quadrado da distância 
à fonte para uma onda esférica. 

No experimento de Young com luz monocromática, a função de onda resul- 
tante num ponto P é a soma de duas contribuições, uma proveniente do orifício P; 


e outra de Ps : 


Ela. )= Rel nte +» wa] 67) 


Logo, a intensidade resultante em P é 


“O = Di T (3.8) 
d x 
Como le'º'| = 1,0 fator temporal não afeta o resultado. Por essa razão, em 
todo o tratamento de ondas monocromáticas daqui por diante o fator temporal 
e“ será omitido; trabalharemos diretamente com a função de onda resultante 
v(x) , ficando subentendido que o resultado completo, dependente do tempo, é 
dado pela (3.2). 


A (3.8) pode ser escrita 


1)=| 


PRA 


(3.9) 


ed 
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onde indicamos separadamente o módulo e a fase (argumento) de cada número com- 
plexo. Resulta 


169= (þa +] 


(3.10) 


cuja interpretação geométrica em termos 
do diagrama de Argand no plano comple- 
xo (fig. 3.5) é relacionar o módulo da re- 
sultante de dois vetores com cada um de- 
les. Como Iv; É é a intensidade 1, devida 
somente à onda vı (analogamente para 


6), © resultado pode ser reescrito: 
(3.11) 


onde 


(3.12) 


O último termo da (3.11) chama-se termo de interferência, e à (3.11) é a lei 
básica da interferência entre duas ondas. 

Temos interferência construtiva quando A = 2an (n=0,t1,42,.) , 
cosA = l , e interferência desirutiva quando A = (2n + I)T. cosÃ=-—1: 


ja aimi afe QE +J) (construtiva) 


(3.13) 


ii 


iA=Qa+ria=s]= (1-5) (destrutiva) 


Em particular, se as duas ondas têm a mesma intensidade (4 = b), resulta 


1 
1=41, mr 
(3.14) 


| 
L=} 
= y = 0 (destrutiva) 


Efeitos de interferência como esses são característicos de ondas, e inexplicá- 
veis numa teoria corpuscular da luz, quando esperaríamos que a intensidade resul- 
tante fosse a soma das intensidades, sem termos de interferência. É particularmente 
intrigante que “luz mais luz” possa resultar em escuridão! 


3.2 Análise do experimento de Young 

© No experimento de Young (fig.3.6), ti- 
turas é muito pequena em confronto 
com a distância entre os anteparos «À e 

O ©. Vamos tomar como orifícios fendas 

longas (perpendiculares ao plano da 

fig. 3.6), de modo que a figura de in- 

terferência observada terá a mesma 


simetria (tomamos a fonte F sobre o 
Fig. 3.6 Experimento de Young eixo). 


De conformidade com o Princípio de Huygens, os pontos Pı e P> funcionarão 
como fontes puntiformes, gerando ondas esféricas. Como são excitados pela mesma 
frente de onda incidente F, oscilarão na mesma fase (tomamos a origem das fases 
sobre A, para simplificar) de forma que podemos representar a função de onda no 
ponto de observação P (contribuições de P; e P>) por 


ii q A iin 
Em pg (3.15) 


v(P)= 


pois, devido à excitação simétrica, as amplitudes A também serão as mesmas; na 
Gah t = BP en s aP. 
Seja R 


PO. Como d << R , vemos na fig. 3.6 que 


n= R-2sn0 
2 
(3.16) 


n 


R+ Zsa 
2 
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Nos denominadores da (3.15), podemos substituir rı e rz por R , com erro 


desprezível. Entretanto, isso não se aplica aos expoentes das exponenciai 


+ pois 
d à 
PAS pe (3.17) 


Com efeito, a distância d entre as fendas é tipicamente muito maior que o 
P 
comprimento de onda no visível, 
Logo, 


exp fikra Hc sen o) (3.18) 
k 


v(P) = Sem (url eno)+ 


ml» 


A intensidade resultante é da forma (3.11) com 


4 
h=hº (3.19) 
e 
A=,- =kdsenO (3.20) 
cuja interpretação física é imediata; 
dsen6 (3.21) 
é a diferença de caminho entre as contribuições de Ps e P, 
A (3.11) fica então 
af A 
I =2], (l +cosA)= 41 cos? z (3.22) 


onde 1, é a intensidade que resultaria se uma única fenda estivesse aberta. 
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41, 
PN 77 AN A intensidade é máxima em O” (fig. 3.6), 
i H \ N / 1 \ onde O = O (contribuições em fase), e os- 
! | | 
| / | E. cila periodicamente entre 47, e O, confor- 
E Vi me indicado na fig. 3.7, correspondendo 
i J Foi 


>A a franjas de interferência claras e escu- 
ras. 


-0 -2 i 0 T 2 E 
Fig. 3.7 Intensidade em função da defasagem 


O espaçamento angular entre dois mínimos (ou máximos), como sen8 = 6 nas 
condições consideradas, é 


TR A 
AG = ta d <1) 623) 


e o espaçamento correspondente, no plano de observação O, é ~ RA 9. 
Para A=5x10ºem , d= 
R~2m=2x10cm, o0 espaçamento das franjas é RAQ ~ 2 mm. 


.Smm=5x10?em , temos A0- 10°rad c , se 


Pelas (3.20) e (3.21), as condições de interferência construtiva e destrutiva se 
interpretam facilmente: 


h-h=nA>A=2nm (construti 


(aee (n + Da => A =(2n+1)x (destrutiva) 


(3.24) 


Nas palavras de Young, “O centro ... é sempre brilhante, e as faixas brilhantes 
de ambos os lados estão a distâncias tais que a luz, chegando a elas de uma das 
aberturas, terá percorrido uma distância maior do que a que vem da outra, de um 
intervalo igual à largura de uma, duas, três ou mais das ondulações, ao passo que 
as escuras correspondem a uma diferença de meia ondulação, uma e meia, duas e 
meia, ou mais.” Young usou os resultados para estimar, com razoável precisão, os 
comprimentos de onda associados aos extremos violeta e vermelho do espectro. 

Para pontos P entre A e O no plano da fig. 3.6, as equações (3.24) definem 
uma família de hipérboles r» — rı = constante com focos em P, e Pz , que são os 
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lugares geométricos das linhas nedais e aniinodois, intersecções de cristas com 
vales ou, respectivamente, de cristas (vales) com cristas (vales), para frentes de 
ondas secundárias emanadas de P, e P>. Essas hipérboles são visíveis em experiên- 
cias com tanques de água e ondas bidimensionais na superfície da água. 

Poderia parecer à primeira vista que intensidades duplas das que resultariam da 
soma das intensidades devidas a cada abertura isoladamente violariam a conservação 
de energia, mas há uma compensação entre interferência destrutiva e constmtiva. 

Com efeito, se calcularmos a intensidade média das franjas sobre uma 
região que contém várias franjas, o valor médio de cos (A (2) na (3.22) é 1/2 
[ef.(3.5)], o que dá para a intensidade média 


<1>=21 (3.25) 


que é a soma das intensidades devidas às duas aberturas. A figura de interferência 
corresponde apenas a uma redisiribuição dessa intensidade média. 

As franjas também podem ser observadas (o que Young fez) com luz incidente 
branca, como a luz solar. Nesse caso, a franja central é branca mas as laterais são 
coloridas: cada cor do especiro produz uma figura com espaçamento diferente, e as 
cores observadas resultam da superposição dessas figuras. Só aparece um número 
limitado de franjas nesse caso, pois longe do centro muitas figuras desigualmente 
espaçadas, e de cores diferentes, se superpõem. 

Para que se observe interferência, porém, é essencial, na expressão de Young, 
que as duas porções de luz assim combinadas... sejam originárias da mesma fon- 
te”, isto é, que provenham da mesma frente de onda incidente F na fig. 3.6 (devida 
à fonte puntiforme F, que pode ser produzida com luz solar). Essa condição foi 
empregada quando admitimos, na (3.15), que P; e P3 oscilam em fase. Ela está 


associada à idéia de coerência, que voltaremos a discutir mais adiante (Seg. 3.6). 


3.3 Interferência em lâminas delgadas 


Algumas das cores mais belas observadas na Natureza, como as cores das asas 
de borboletas e da plumagem de beija-flores, resultam de eteitos de interferência da 
luz ao atravessar lâminas delgadas de materiai 
das bolhas de sabão. 


transparenies — é o caso também 


Nesse caso, a luz sofre reflexões múltiplas entre as faces da lâmina, e a inter- 
ferência não envolve apenas dois feixes, como no experimento de Young; é uma 


interferência de feixes múltiplos. 
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Com efeito, consideremos uma lâmina 
de índice de refração n e espessura d 
situada no ar (7 = 1), e um raio in- 
cidente OA (fig. 3.8). Ele dá origem a 
um raio | parcialmente refletido e um 
raio AB refratado. Em B, há nova re- 
flexão e nova refração parcial (raio 
transmitido 1). Este processo conti- 
nua a se repetir, embora a intensidade 
vá diminuindo a cada reflexão. Temos 
assim raios refletidos 1, 2, 3, ... e 
raios transmitidos 1,2’ ,... (fig. 3.8). 


Fig. 3.8 Interferência de feixes múltiplos 


Os efeitos de interferência na luz refletida (soma das contribuições de 1 + 2 + 
3 +...) ou transmitida (raios V + XY +...) dependem da diferença de caminho 
ótico entre dois raios consecutivos refletidos ou transmitidos. 

Com efeito, como vimos na (3.3), o fator de fase associado a um percurso / de 
uma onda num meio de índice de refração n é 


exp (Ek I) = exp (i kọ n1) = exp Es n r) 3.26) 
to 


onde ìo é o comprimento de onda no vácuo (ar) e nl o caminho ótico correspon- 
dente ao percurso l. 

Para calcular a diferença de caminho ótico entre os raios 2 e 1, notemos que 
CC” (1 ao raio 2 ) pode ser considerada como frente de onda transmitida asso- 
ciada à frente de onda A A’ (L ao raio BC ). Logo, os caminhos óticos [AC'] e 
[A/C] são iguais (compare com a fig. 2.12). 

A diferença de caminho Ótico entre os raios 2 e | seria entao 


n(AB+BA)=n(AB1BA)-n AA =n AA cos6, 


onde AA, = 


Finalmente, representando a diferença de caminho ótico por [2] — [1], viria 
(veja a fig. 3.8) 


= d (A é a imagem especular de A). 


pJ-[]=2n4coso, [veja porém a 28] (227) 
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Essa é também, pela simetria da figura, a diferença de caminho ótico [2] — [1°] 
entre dois raios transmitidos consecutivos. 

Pareceria então que, quando há interferência construtiva para a luz transmitida, 
a interferência é também construtiva para a luz refletida. Isso seria incompatível 
com a conservação da energi 
deveria corresponder a um mínimo da intensidade total refletida. 


pois um máximo da intensidade total transmitida 


A origem dessa dificuldade está em termos admitido tacitamente que não há 
mudança de fase na reflexão. Isso não é sempre verdade. 

Já vimos para outros tipos de ondas que, quando uma onda se reflete na inter- 
face entre dois meios, pode refletir-se sem mudança de fase ou com mudança de 
fase de n (troca de sinal: e'7 = — 1), dependendo das condições de contorno, ou 
seja, do que acontece na interface m 

Assim, um pulso que se reflete na extremidade fixa de uma corda vibrante 
volta invertido (defasagem de x ), ao passo que não muda de fase ao refletir-se 
numa extremidade livre (Fís. Bás. 2, Seç. 5.6). Analogamente, uma onda acús 
de deslocamento se reflete com mudança de fase de 7 numa extremidade fechada 
de um tubo de órgão, mas sem defasagem numa extremidade aberta (idem, Seç. 
6.4). 


Na fig. 3.8, vemos que a onda refletida 1 corresponde à reflexão vindo de um 


a 


meio menos refringente (ng = | ) ao encontrar outro mais refringente (n > 1), ao 
passo que a reflexão de 2 no ponto B é de um meio mais refringente para um 
menos refringente. 

Para ver que tem de existir uma defasagem adicional de 7 (mudança de sinal) 
num desses dois casos, consideremos o que acontece quando a espessura d da lá- 
mina — 0. Nesse limite, não pode haver reflexão: toda a luz deve ser transmitida. 
Logo, tem de haver uma defasagem adicional de 7 numa das interfaces (de no para 
n ou de n para no ), para que as contribuições de 2 e 1 tenham sinais contrários. A 
(3.27) deve ser então substituída por 


PJ- []= 27d cos6, + 5a, G28) 


pois uma diferença de caminho de $ Žo no ar corresponde a uma defasagem de T. 

Por outro lado, o raio 3 sofre duas reflexões adicionais em relação ao raio 2 
(nos pontos C e D da fig. 3.8), ambas de n para n , de modo que sua contribuição, 
bem como as de 4, 5, ... tem o mesmo sinal que a de 2. Assim, quando d > 0 
devemos ter, 
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contribuição de 2 + 3 + 4+... CANCELA à contribuição de 1 (d > 0) 


todas cm fase fase oposta 


(3.29) 
Pode-se demonstrar explicitamente que é isto que acontece (cf. Seç. 3.4). 

Por outro lado. para os raios transmitidos, duas contribuições consecutivas, 
como as de 1º e 2", diferem por duas reflexões adicionais, ambas de n para mo (em 
B e em C), de forma que todas entram com o mesmo sinal e se reforçam, quando 
d > 0, levando à transmissão total neste limite, conforme esperado. 

Veremos mais tarde, na teoria eletromagnética da luz (Seç. 5.6), como conse- 
quência das condições de contorn 
o raio vem de um meio menos refringente (como o ar) para im mais refringente 
(como o vidro), nas condições usuais em que a interferência é observada. 


que a defasagem adicional de x ocorre quando 


A expressão (3.28) para a diferença de caminho permite encontrar as condi- 
ções de interferência construtiva ou destrutiva para a luz refletida, que, pelo que 
acabamos de ver, são complementares às que prevalecem para a luz transmitida: 
quando uma delas é construtiva, a ontra é destrutiva. Máximos de reflexão corres- 
pondem a mínimos de transmissão, e vice-versa. Obtemos assim: 


2ndcos6, = m hy (m 


Em MÍNIMO de reflexão 
MÁXIMO de transmissão 


MÁXIMO de reflexão 
MÍNIMO de transmis 


ão 


1 
2ndcosB, = GE (m =0,1,2,.)> [ 


(3.29) 


Como no caso limite d — O. demonstra-se que os mínimos de reflexão cor- 
respondem a reflexão nula, ou seja, à transmissão total” 

Para observação próxima da direção normal ao filme (6, = 8: = 0), se for- 
mos aumentando a espessura do filme a partir de 0, o 1.º máximo de reflexão 
(m = 0) ocorre para 


= Isso corresponde so fato de que a intensidade varia periodicamente com a defasagem A = ky (2nd cos 65), 
com período 2r (veja a fig. 3.12 abaixo). 


1h A 
4n 4 (3.30) 


d= 


onde À é o comprimento de onda no interior do meio (k = nko > À =h/n): 
diz-se que se tem um “filme de um quarto de onda’ 


Se tivéssemos considerado uma situação em que a lâmina separa dois meios de 
índices diferentes, no e mı e O índice de refração da lâmina é intermediário, 
no < n < m, haveria defasagens de n tanto para o raio refletido 1 como para 2. e a 
diferença de caminho ótico correta seria dada pela (3.27). Nesse caso, a (3.30) 
define a condição para o 1.º mínimo de reflexão. 

Isso é aplicado em filmes anii-refletores. A luz que atravessa um sistema de 
lentes, numa máquina fotográfica 
cada lente. Embora a perda de intensidade associada seja pequena para raios 


p. ex., sofre reflexão parcial na superfície de 


paraxiais, a perda total após várias interfaces pode ser apreciável, além dos efeitos 
indescjáveis da luz difusa. 

Para eliminar a reflexão, deposita-se nas superfícies de todas as lentes em con- 
tato com o ar um filme dielétrico de 1/4 de onda, de índice intermediário entre os 
do ar e do vidro. Como o índice de refração varia com À, escolhe-se À na região 
mais luminosa do espectro visível, entre o amarelo e o verde. Por isso, lentes com 
tais depósitos refletem a cor complementar, de tom púrpura (lentes “azuladas”). 


Se tivermos um meio de espessura 
variável (no ar), observado com 


9 = @ = 0, a condição de interferência 


destrutiva, com luz incidente monocro- 
essura mática, será satisfeita para espessuras 
d=0,d=A/2,d=Ah onde apare- 
cem franjas escuras na luz refletida, co- 


Fig. 3.9 Franjas de igual esi 


nhecidas como franjas de igual espessura (fig. 3.9). 
Numa lâmina de água de sabão formada sobre um aro e colocada num plano 
vertical, a água escorre para baixo, formando uma cunha. Observando com luz 


branca, as franjas escuras aparecem em alturas diferentes para diferentes À ; a luz 


refletida tem a cor complementar, 
bolhas de sabão. No topo da lâmina ou de uma bolha antes de estourar, aparece 
uma mancha preta, mostrando que a espessura da lâmina tornou-se menor que X/4 


formando as cores de interferência típicas de 


para todos os À no visível. 


| A 
Se colocarmos uma lente plano-convexa 
| sobre uma placa de vidro plana (fig. 
3.10), forma-se entre elas uma lâmina de 
ar de espessura variável, permitindo ob- 
servar, tanto na luz refletida como na 
transmitida, franjas de interferência de 


igual espessura, sob a forma de anéis 


concêntricos, que são os anéis de New- 
ton. Eles já haviam sido observados por 


4 Robert Boyle em 1663, mas Newton de- 


terminou com grande precisão a relação 
Fig. 3.10 Anéis de Newton 


ente seus raius É a espessura da camada 


onde se formam, e deu uma explicação ondulatória da sua origem, em termos das 


ondas que associava aos “acessos de fácil reflexão e fácil transmissão”. Além dis- 
so, usou-os para medidas altamente precisas de comprimentos de onda da luz! 

Uma aplicação prática importante das franjas de igual espessura é testar até 
que ponto uma superficie ótica é plana, colocando-a em contato com uma super- 
fície plana padrão c observando as franjas de interferência formadas na lâmina de 
ar entre as duas superfícies, que indicam as linhas de nível da superfície testada. A 
superfície testada pode ir sendo polida até tornar-se “oticamente plana”. 


Outros exemplos de cores de interferência são as cores das manchas de óleo 


sobre asfalto molhado, c as da plumagem de beija-flores ou de asas de borboletas. 
Numa asa de borboleta azul, por exemplo, a interferência se produz em lâminas 
delgadas que recobrem a asa formando “terraços”: há um máximo de reflexão no 
azul para incidência perpendicular; o tom de azul varia com o ângulo de observação. 
correspondendo à variação com 8, do comprimento de onda associado à interferência 
construtiva. Placas transparentes análogas existem na plumagem dos beija-flores. 


32.4 Discussão das franjas de interferência 


Se a luz refletida por uma lâmina for 
coletada por uma lente L (fig. 3.11), for- 
mar-se-á num ponto P do seu plano focal 
uma imagem puntiforme brilhante ou es- 
cura conforme o ângulo 8: corresponde a 
um máximo ou mínimo de reflexão (a 
lente pode representar também o olho de 
um observador). 


Fig. 3.14 Imagem de interferência 


Isso vale para raios incidentes numa só direção 6, . Entretanto, se tivermos 
uma fonte de luz extensa iluminando a placa, haverá raios incidentes em toda uma 
faixa de ângulos 0, e a intensidade das imagens correspondentes variará conforme 
o valor correspondente da defasagem, correspondendo a um valor bem definido 
para cada inclinação 0, . Observam-se nesse caso franjas de interferência de igual 
inclinação. 

Até aqui discutimos apenas os valores de 9: para os quais a intensidade re- 
fletida (ou transmitida) é máxima ou mínima, sem analisar como varia a intensi- 
dade entre os máximos e os mínimos. 

A variação depende da rejletividade r das interfaces, que é a porcentagem de 
reflexão, ou seja, a fração da intensidade incidente que se reflete. Como vimos na 
Seç. 2.4, r varia com o ângulo de incidência (cf. Seç. 5.7): em geral, é pequena 
(alguns %) na incidência perpendicular (6, = 0) e tende a aumentar com 6. Na 
passagem para um meio mais refringente, r —» 1 (100% de reflexão) para 
04 — 7/2 (incidência rasante). 

A refletividade também aumenta com o índice de refração relativo rnz : quanto 
mais forte a descontinuidade entre os dois meios, maior é r. Pode-se aumentar r 
depositando na interface um filme composto de uma ou mais camadas delgadas de 
meios transparentes de índices convenientemente escolhidos (efeito oposto a um 
filme anti-refletor). Também se pode depositar um filme metálico fino: tem-se en- 
tão uma lâmina semi-espelhada, como as que são usadas em alguns óculos de sol; 


neste caso, uma fração da intensidade é absorvida no interior do metal. 


A fig. 3.12 [baseada na (3.35) abaixo] 
mostra a variação da refletividade total R 
da lâmina e de sua transmissividade total 
(frações da intensidade incidente sobre 
a lâmina que se refletem ou transmitem, 
a respectivamente), em função da de- 
E raios sucessivos, 


T 2r 3n 4n 516 q fasagem entre doi 


Fig. 3.12 Refletividade e transmissividade 
em função da defasagem 


* A defasagem A, pela (3.26), é o produto de k pela diferença de caminho ótico (3.27). 


> |A=2nkydeos0, = SÊ - 2ndcos®, (3.31) 


ho 


para incidência perpendicular do ar sobre o vidro, com 7 = 0,04. A conservação da 
energia dá 


R 


J=] (3.32) 


de modo que os dois gráficos são complementares: refletividade R = 0 corresponde 


o total pela lâmina, J 
5) abaixo. 


= 1. As expressões para R e F decorrem da 


A visibilidade ou contraste das franjas na luz transmitida é definida por 


G 


que neste caso é (1,0 — 0,85) / (1,0 + 0,85) = 0,08 : as franjas são pálidas, com 


pouco contraste de intensidades. 


O gráfico da fig. 3.13 mostra como F 
varia à medida que r aumenta: as fran- 


jas vão ficando cada vez mais nítidas 


e mais estreitas, com um contraste 


crescente entre máximos e mínimos. 
Por que isso acontece? 


2m (ni mim 


Fig. 2.13 Variação de J com r 


Para compreender esse efeito, notemos que r é a razão das amplitudes de dois 
raios consecutivos na fig. 3.8 (como 2” e 1). Com efeito, essas amplitudes dife- 
rem por duas reflexões adicionais na interfaces (nos pontos B e C), em cada uma 
das quais a amplitude é reduzida por um fator Vr (r é a razão da intensidade 
refletida à incidente). 

Por outro lado, a diferença de fase entre dois raios consecutivos é A . Usando 
notação complexa, concluímos que a contribuição do raio 2º difere da de 1” por um 
fator re”. Logo, a soma das amplitudes complexas de todas as contribuições 
transmitidas 1,2,3... é proporcional a 


(3.34) 


(soma de uma progressão geométrica de magnitude da razão r < 1). Na realidade, 
há um n.º finito de contribuições, mas, se o n.º total N de reflexões é grande, 
ireny E desprezível, por ser r < 1 

Por que razão a magnitude da soma (3.34) varia muito mais rapidamente 
com A para r próximo da unidade do que para r<< 1, como ilustrado na fig. 
3.13? 

Se representarmos os termos da soma no plano complexo. obtemos uma soma 
de vetores, em que cada termo difere do anterior por ter sua magnitude multipli- 
cada por r e seu ângulo de fase acrescido de A (rotação por um ângulo A ). Vamos 


comparar as resultantes tomando 4 termos e A = 0.5e 5, com r = 0,25 num caso 


sta 


e r = 0,8 no outro (fig. 3.14). Vemos que a resultante R decresce muito mais rapi- 
damente, quando A aumenta, no 2.º caso do que no 1.º (o comprimento de R foi 
ajustado para ser o mesmo nos 2 casos, para À = 0, quando F = 1). Quando r é 
pequeno. a resultante é praticamente a soma dos 2 ou 3 primeiros termos, sendo 
pouco afetada pelas defasagens: quando r é próximo de 1, os vetores “espiralam” 


rapidamente com o aumento de A e R decresce logo. 


0,25 


> a-0 
R 
R 
z 
4 
R | 
= H 
AE R 


Fig. 3.14 Variação da resultante com r 
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Assim, para r próximo da unidade, as franjas de interferência na luz transmi- 
tida adquirem o aspecto de riscas brilhantes e muito estreitas (máximos de trans- 
missão) num fundo escuro. 

A largura (em termos da defasagem A ) das franjas de interferência é da ordem 
det= 1 —7,a transmissividade de uma das interfaces. Com efeito, em cada re- 
flexão interna, uma fração r da intensidade é refletida e uma fração 1 é transmitida. 
Logo, o número de reflexões sofridas por um raio antes que a maior parte de sua 
intensidade tenha sido transmitida é da ordem de 1/t Para A = 2mr7, os raios 
interferem em fase. Para A = 2m7 + £, a defasagem acumulada após | /f refle- 


xões é da ordem de €/1, e a interferência começa a se tornar destrutiva quando esta 
defasagem é ~ 1, confirmando que a largura das franjas corresponde a £ ~ t. 

A razão pur que í tem de ser pequena para que as franjas sejam estreitas é 
portanto que, quando o número médio de reflexões sofridas antes da emergência do 
raio é grande, uma variação muito pequena da defasagem, devido ao efeito cumu- 
lativo, já é suficiente para levar da interferência construtiva à destrutiva. 

Para uma discussão mais quantitativa da largura das franjas, calculemos a in- 
tensidade associada à amplitude complexa (3.34), que é proporcional à transmis- 
sividade total F: 


1 


1 
(re re) rr As se) 


1 1 1 
De areosa GOF +2rf-csa) p parsen? [E 
E né (5) | 


e R = 1 - F. As figs. 3.12 e 3.13 baseiam-se nesses resultados. 
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Com ż << 1 (r= 1), consideremos um pequeno deslocamento de fase 
e(lel<< 1) a partir de um máximo de interferência, A = 2m7 + €. Temos en- 
tão, 


(3.36) 


A distância entre os pontos nos quais 
a transmissividade total F cai à 
metade do seu valor máximo (fig. 
3.15) definc a semilargura do pico. 
Vamos na (3.36) que esses pontos cor- 
respondem a € = £ t, de forma que a 


semilargura das franjas na variável A é 


Fig. 3.15 Semilargura 


o que concorda com a discussão qualitativa anterior. 


3.5 interferômeiros 


A condição (3.29) para um máximo de transmissão, escrita em termos da de- 
fasagem A [cf. (3.31)]. 


A = End cos6 =2mn (m=0,1,2,..) (3.38) 
o 


depende do comprimento de onda Xy incidente. Assim, se a luz incidente contém 
dois comprimentos de onda diferentes superpostos, as posições dos máximos de 
interferência correspondentes na luz transmitida serão diferentes. 
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êndi 


Se as franjas brilhantes forem suficientemente estreitas, isto permite separar 
comprimentos de onda, mesmo que sejam muito próximos. É nesse princípio que se 
basciam os interferômetros, instrumentos empregados em espectroscopia para ana- 
lisar a estrutura fina e hiperfina das linhas espectrais, para comparar comprimentos 
de onda entre si ou com o metro padrão (medida absoluta de Às ). 

A principal qualidade de um interferômetro para análise é o seu poder separa- 
dor, definido como o inverso da menor variação fracionária 8./À. que ele permite 
determinar. ou seja 


H 
| Poder separador = É (3.39) 


A fig. 3.16 mostra dois picos de intensi- 
dade. associados aos comprimentos de 
onda ĵo e Ào + d À, cujos centros distam, 
na variável A, de uma defasagem igual à 
semilargura g de cada pico. Costuma-se 
adotar como critério que esse é o menor 


valor de 8À que ainda permite distinguir 


Fig. 3.16 Limite do poder separador as duas franjas de interferência. 


Com efeito, a intensidade resultante (em linha interrompida na fig. 3.16) tem 
uma pequena depressão central que permite detetar o pico duplo, mas que já não 
apareceria se os centros estivessem mais próximos. 

Suponhamos que o pico associado a Ay corresponda à ordem 2 m de interferên- 
cia, ou seja. que satisfaça a (3.38). A mesma direção 6» deve então corresponder a 
uma defasagem 2mm — 2£ para ko + 6, ou seja 


a(iç+81)= zii é É 


o que dá 
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(3.40) 


onde usamos a expressão (3.37) para a semilargura devida a uma lâmina de faces 
paralelas. 
Por conseguinte, a semilargura é diretamente proporcional à ordem de inter- 
ferência e inversamente proporcional à transmissividade da interface da lâmina. 
Para estimar m, podemos tomar ncos6> da ordem da unidade. Pela (3.38), 
temos então 


m-2d 1h (841) 


Assim, com Àp ~ 5 x 107cm , uma placa de espessura d ~ 1 cm corresponde a 
m ~ 4X 10°. Se a refletividade r da interface fôr 0.9, a (3.40) dá 


47x] é 
de= a TH; 
BA 107 


o que permite separar duas linhas espectrais com A/A ~ 10º (variação fracioná- 
ria de ~ l ppm = 1 parte por milhão). 


O interferômeiro de Fabry-Perot (fig. 
3.17) é um par de placas paralelas de 
vidro ou quartzo. na face interna das 
quais são depositados filmes de re- 
fletividade elevada. 


Fig. 3.17 Interisrômetro de Fabry-Perot 


Para observar as franjas, coletam-se os feixes transmitidos paralelos por meio 
de uma lente L, que os focaliza num ponto P do anteparo de observação O. A fonte 
de luz é uma fonte extensa $, que envia raios incidentes em diferentes direções. 

Pela simetria do dispositivo em torno do eixo da lente, são observadas franjas 
de igual inclinação 6 de forma circular (interseção do plano O com um cone de 


abertura O c eixo no eixo de simetria da lente). 
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A lâmina de faces paralelas nesse caso é a lâmina de ar de espessura d (= sepa- 
ração entre as placas), de forma que n = 1, e à condição que dá o máximo de 
interferência de ordem m, pela (3.38), é 


“E q cos0,, =2m7| (3.41) 


do 


que dá o ângulo de abertura 8, do cone correspondente a cada ordem mm. 

O poder separador do interferômetro de Fabry-Perot é dado pela (3.40), e atin- 
ge valores extremamente elevados, permitindo detetar a estrutura hiperfina de raias 
espectrais, separando comprimentos de onda muito próximos. Tomam-se cuidados 
especiais para assegurar o paralelismo (o padrão resultante chama-se étalon) e man- 


ter constante a distância d. 


No interferômeiro de Michelson, luz 
de uma fonte $ é subdividida (fig. 
3.18) em dois feixes perpendiculares 
por uma lâmina semi-espelhada depo- 
sitada sobre uma placa de vidro P;, a 
45º do feixe incidente. O feixe refle- 
tido vai a um espelho Er, que o manda 
de volta e para a lente L, depois de 
atravessar novamente Pı. O feixe trans- 
mitido pela lâmina semi-espelhada vai 


E para outro espelho E; (fig. 3.18) e, de- 
He L : pois de refletir-se na lâmina, vai tam- 
bém para L (a placa P», idêntica a P, 
T mas não-espelhada, é inserida para 
compensar a diferença de caminho óti- 
e ETR co correspondente ao duplo atravessa- 


r ia r mento de P; pelo feixe que se reflete 
Fig. 3.18 Interierômeiro de Michelson 
em E; ). 
Os dois feixes interferem no plano de observação ©, onde são focalizados pela 
lente L. Se E é a imagem especular de E, na lâmina semi-espelhada (fig. 3.18), as 
condições de interferência construtiva ou destrutiva são as mesmas que para a 
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lâmina de faces paralelas formada por E; e E. para o par de raios (aqui não há 


reflexões múltiplas). 

Como o raio que vai para E; sofre reflexão interna na camada espelhada, e o 
que vai para E; é refletido externamente, 
(3.29), com n = 1, dá 2d cos = mo (m=0, 


destrutiva, onde d = |h — hl é a diferença de caminho (anéis escuros). 


há uma defa: m adicional de m, e a 


) para interferência 


O interferômetro de Michelson permite detetar diferenças extremamente pe- 
quenas de caminho ótico entre os dois braços perpendiculares do percurso dos 
raios. Uma diferença de caminho Ao( Am) representa um deslocamento de Am 


franjas. É possível estimar visualmente deslocamentos até de Am ~ 1 de franja. 
j P S j 


3.6 Coerência 


No final da Seç. 3.2 foi reproduzida a observação original de Young. de que é 
essencial, para observar efeitos de interferência entre diferentes trajetos da luz, que 
eles se originem da mesma fonte. 

Para ver por que motivo isso é importante, consideremos primeiro um pro- 
blema análogo ao que acabamos de discutir, uma superposição de muitos feixes de 
luz, todos monocromáticos e de mesma frequência angular © , propagando-se na 


mesma direção, mas com defasagens relativas distribuídas ao acaso. Isso sucede- 
ria, p. ex., se eles provêm todos de fontes de luz diferentes, cujas fases de oscilação 
são independentes entre si. 

Num dado ponto do espaço, a onda luminosa é então da forma (em notação 


complexa) 
x o: m 
E = FAEM (3.42) 
a 


onde A; é a amplitude real da j-ésima contribuição e q; sua constante de fase no 
ponto considerado. 


A intensidade correspondente é proporcional a 


(3.43) 


ou seja, 


onde explicitamos, na soma sobre j + k , os termos ( j, k) e (k, j) (daí somarmos só 
sobre j < k). Finalmente, como a intensidade 1; é proporcional a | E; E 


= Ey, 128 Slide cos (o =) (3.44) 


que é uma generalização da lei de interferência de 2 feixes (3.11). O último termo, 
que é o termo de interferência, depende das diferenças de fase An = M — (H. 

Como as fases q; estão distribuídas ao acaso, o mesmo vale para as diferenças 
Ajr . Para N grande, os valores de cos( q: — q;) na (3.44) tendem então a estar 
equidistribuídos, com valores positivos e negativos igualmente prováveis. Supondo 
as intensidades comparáveis, vemos que o termo de interferência tende a se can- 
celar [como num passeio ao acaso no plano (Fís. Bás. 2, Seç. 12.4)]. Desprezando 
pequenas flutuações, temos então 


Ta | (345) 


ou 


seja, a intensidade resultante é a soma das intensidades devidas às diferentes 
Juntes, sem termos de interferência, Dizemos que as fontes são incoerentes. 

Que relevância tem esse resultado, onde tomamos um grande número de fontes 
diferentes, para o experimento de Young ou para o interferômetro de Michelson, 
onde apenas dois feixes interferem? Poderíamos pensar que as franjas de interferên- 
cia ainda apareceriam mesmo com feixes originários de duas fontes diferentes, p. 
ex., dois filamentos de lâmpadas incandescentes, desde que a luz de cada fonte 
fosse devidamente filtrada (um filtro vermelho deixa passar predominantemente luz 


vermelha), para torná-la tão monocromática quanto possível. Entretanto, se fizer- 
mos a experiência dessa forma, com duas fontes de luz diferentes, a interferência 


não é observada: elas se comportam como fontes incoerentes. Por que? 
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3.6 Coz 


A razão é que uma fonte de luz usual, como um filamento incadescente ou o 
Sol, é formada de um grande número de fonies microscópicas independentes (não 
correlacionadas), cada uma das quais atua durante um tempo muito curto e, se volta 
a atuar, sua fase inicial não guarda a memória da fase de oscilação anterior, o que 
produz uma situação análoga à da (3.43). 

A duração típica de um processo de emissão de luz por um átomo excitado é 
da ordem de 107ºs. Assim, mesmo para uma única fonte de luz térmica que se faz 
passar por um filtro de frequência, a luz emitida não oscila no tempo como uma 
senóide ininterrupta: podemos representá-la como uma sucessão de trens de onda 
sinusoidais finitos, cada um com duração média associada a um processo de emis- 
são, mas interrompido, è as fases iniciais de cada um deles variando ao acaso. 

Essa imagem pode ser testada experimentalmente usando o interterômetro de 
Michelson. Com efeito, se a fonte de luz S na fig. 3.18 é uma fonte de luz térmica, 


verifica-se que a visibilidade das franjas de interferência tende a diminuir à medida 
que a diferença de tempo de percurso entre os dois braços. T = 21b — hl/c. vai 
aumentando, e as franjas desaparecem para T apreciavelmente maior que um inter- 
valo de tempo A T característico da fonte de luz, chamado tempo de coerência. 

A interpretação desse resultado em termos da imagem de trens de onda inde- 
pendentes é imediata: um trem incidente de duração típica A T é dividido em dois trens 
de mesma duração pela lâmina semi-espelhada. Para que possam interferir após os per- 
io que o atraso T seja inferior à largura temporal AT 
de cada trem: caso contrário, não há superposição dos dois trens. Trens de ondas 
diferentes não interferem porque as defasagens entre eles variam ao acaso. 


cursos nos dois braços, é neces: 


A duração finita At de um trem de ondas também está associada com seu 
caráter não-monocromático: em lugar de uma única frequência angular q» , ele 
cobre uma faixa de frequências de largura A œ. 


Com efeito, consideremos uma superposição de ondas de frequências q va- 
riáveis continuamente entre Go — + Ame Q + + Aq, admitindo, para simplificar. 
que todas tenham a mesma amplitude A num dado ponto do espaço, e vejamos 
como varia com o tempo a onda resultante: 


Aedo (3.46) 


Pensando na integral como limite de uma soma, vemos que isso representa 
efetivamente uma superposição contínua de ondas. 
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Com a mudança de variável © = q + u , e notando que À é uma constante, 


fica 


E()= aeaf 


Ao 
acer 2 

it)| Ao 

EE 


(347) 


tl (2.48) 


pela (3.48), entre os pontos 


A = gem 
2 


A fig. 3.19 é um gráfico da função 
(sen?v)/v?, que é = 1 parav=0c 
se anula nos pontos 
Wm=>mu(m=+1,+2,...) 

Temos (sen?v)/v? < 1/ v? , função 
que cai rapidamente quando v cresce. 
Cerca de 91% da área sob a curva 
caem debaixo do pico central, na re- 
gião entre v =- 7 ev =T, ou seja, 


27 
Aq 


Logo, a largura temporal do trem de ondas (3.46) (também chamado “pacote 


de ondas”) é 


ar ZE Lo (was) (3.49) 


correspondendo à ordem de grandeza da largura do pico central da figura, 

Vemos nesse exemplo que o tempo de coerência At é da ordem do inverso da 
largura Av em frequência do pacote de ondas de luz considerado, também chamado 
de largura espectral do pacote. Para o caso ideal de luz perfeitamente manocro- 


mática, Av — 0, teríamos AT > es, 

A relação (3.49) entre largura espectral e largura temporal de um pacote de 
ondas é geral. Para ver por que, notemos que os valores muito pequenos da função 
de onda fora da largura temporal são um efeito de interferência destrutiva entre as 
ondas menocromáticas de que o pacote é composto. 

Com efeito, vemos na (3.46) que todas elas interferem em fase para f = 0, 0 
centro (máximo) do pacote (se quiséssemos ter o pico do pacote em ń , bastaria 
substituir 1 por 7 — to). Para que a interferência comece a passar de construtiva a 
destrutiva, é preciso que a defasagem entre a componente central, de frequência 
O = 2, seja pelo menos de 7, o que dá £ 
o resultado é sindspendênte da forma particular escolhida para o pacote neste exemplo. 


~ n, mostrando que 


É por essa razão que uma estação transmissora de rádio ou TV precisa de 
uma largura mínima de faixa de frequências para transmitir seus sinais. No o da 
TV. p. ex.. o feixe de elétrons tem de varrer ~ 5 x 10° linhas da tela, cada uma 
com ~ 5 x 10º pontos (pixels), a cada =; de segundo, com um sinal transmitindo a 


informação de se ele deve acender-se ou apagar-se. Logo, o número de pulsos de 
voltagem por segundo é ~ 30 x 25 x 10º = 7,5 x 10f, e a duração de cada pulso 
é ~ At = 107" s. Para transmitir um sinal tão curto, a largura da faixa de frequên- 
cias necessária é Av ~ 10/57! = 10MHz , que é a largura típica associada a um 
canal” de TV, e é a ra 

Chama-se comprimento de coerência de um sinal luminoso a distância A ! per- 


corrida pela luz durante o tempo de coerência AT: para propagação no vácuo, é 


zão pela qual há um número limitado de canais. 


(3.50) 


A condição para que dois feixes de luz originários de mesma fonte possam 
interferir é que a diferença de caminho entre eles não exceda o comprimento de 
coerência da luz. Quando essa condição deixa de ser satisfeita, as franjas de inter- 
ferência desaparecem (sua visibilidade > 0). 


78 Interfecôacia 


Para luz “branca”, tem-se Av ~ 0,3 x 10 Hz, o que dá AT ~ 3 x 10 És e 
Al~ 10$m = 1 um ~ A, o comprimento de onda médio da luz. 

Para luz de uma fonte térmica, tornada (com o uso de filtros) tão monocro- 
mática quanto possível, AT é da ordem da vida média de um átomo excitado, da 
ordem de 107*s , como já foi mencionado. Logo, A! < 10em = Im. 


Já para a luz de um laser estabilizado, pode-se ter AT > 107 
ponde a AZ > 10° cm! 
A diferença fundamental entre a luz do laser e luz térmica (luz solar, luz de 


S, O que corres- 


uma lâmpada) é exatamente esta: a coerência elevada da luz do laser. Experiências 
de interferência tornam-se muitíssimo mais fáceis quando se emprega luz de laser. 


Quando giramos o botão de sintonia de um rádio entre duas estações, o alto- 
talante transmite apenas ruído. A luz térmica é análoga ao ruído; a luz de laser, 
nesta analogia, corresponderia a sintonizarmos uma estação que está transmitindo 


uma nota musical pura. 


O comprimento de coerência mede a correlação de fase entre duas frentes de 
onda distantes uma da outra, no sentido longitudinal da propagação da luz, mas 
também é preciso considerar a coerência numa direção transversal, ao longo de 
uma frente de onda. 

Se formos aumentando a distância (L = transversal) dı entre os dois orifícios 
no experimento de Young, a visibilidade das franjas também tende a diminuir, c a 
interferência desaparece para d: >> Adı . onde Ad, depende do grau de colimação 
do feixe incidente: seria co no caso ideal de uma onda plana (raios paralelos). mas 
um feixe de luz real tem uma abertura angular AG > O . Para luz térmica, tem-se 


| 
[Pas e> 
onde À é o comprimento de onda médio da luz. Como À ~ 2n/X(k = número de 
onda médio), a (3.51) também se escreve 


| Ad, (Es 0)- Ad, -Ak +27 | (3.52) 


onde A k: é a “abertura transversal” dos diferentes vetores de onda k da luz inci- 
dente, associada à abertura angular A 0. 

A relação (3.52) é um análogo espacial da (3.49), e voltaremos a discuti-la na 
teoria da difração (Seg. 4.6). Para luz solar, p. ex., À ~ 5 x 10cme AB ~ 0,89, 


À ~ 0,05mm , razão pela qual o experimento de Young com luz solar 
il para um espaçamento d > 0,1 mm. Esta é uma forma indireta de 
medir A O para o Sol. 

Analogamente, podemos usar a (3.51) para estimar o diâmetro angular de uma 
estrela, usando luz da estrela para produzir franjas tipo Young e verificando para que 
separação A d: as franjas tendem a desaparecer (veremos na teoria da difração que há 
um critério quantitativo para não só estimar, como medir A O por este método). 


É o que foi feito por Michelson com seu 
interferômeiro estelar, ilustrado na fig. 
3.20. Luz da estrela incide sobre os espe- 
lhos móveis E; e E, e, depois de refletida 
nos espelhos fixos E; . E4 . é focalizada 
pela objetiva L no plano de observação 
O. Varia-se a distância dı entre E, e E» e 
verifica-se como varia a visibilidade das 
Pl franjas de interferência devidas aos dois 

raios. Com o auxílio de uma relação 
análoga à (3.51). deduz-se daí o diâmetro 
angular A 8 da estrela. 


e 


Fig. 3.20 Interferômotro estelar de Micheison 


Para a primeira estrela cujo diâmetro angular foi medido por esse método, 
Betelgeuse (& Orionis), a separação di foi ~ 3m e Michelson obteve 
AG = 0.047” (segundos de arco). Conhecendo a distância de Betelgeuse à Terra, 
através de sua paralaxe (Fís.Bás. 1, Seç.1.5), foi possível concluir que o diâmetro 


de Betelgeuse é cerca de 300 vezes maior que o do Sol. É difícil aumentar dı muito 


sse valor: o menor A 6 medido por Michelson, o de Arcturus, que é de 
0,02", exigiu dı ~ 8m. 

Em 1954, R. Hanbury Brown e R. Q. Twiss mostraram que era possível de- 
tetar interferências entre flutuações de intensidade entre dois detetores, mesmo para 
separações dı ~ 200m , o que permitiu medir diâmetros angulares de 0,0005"! A 
explicação está relacionada com coerência de ordem superior, e a experiência teve 
um forte impacto no desenvolvimento da ótica quântica. 

A área de um círculo de raio Ad: em torno de um ponto num feixe de luz 
(transversal à direção de propagação) chama-se área de coerência AA , e o volume 


AV-AAAI (3.53) 


onde 41 é o comprimento de coerência, chama-se volume de coerência. Podemos 
interpretá-la como a região do espaço em torno de um ponto P do feixe da qual é 
possível extrair amostras capazes de interferir com a luz em P, ou seja, exibindo 
propriedades de coerência em relação a P. 


PROBLEMAS 


1. Na experiência do espelho de 
Lloyd, observa-se num anteparo O a 
interferência entre a luz que vai dire- 
tamente de uma fonte puntiforme F 
para um ponto P do anteparo O e a luz 
que vai de F para P refletindo-se numa 
placa plana de vidro E (fig.). À distân- 


cia de F ao plano da placa é d e a distância de Fa O é D >> d. Observa-se à 


primeira franja brilhante (máximo) de interferência num ponto P a uma distância y 
do plano da placa, usando luz monocromática de comprimento de onda À. Calcule 
y em função de À, de D. 

Sugestão: Considere a imagem especular de F e a defasagem na reflexão. 


2. No experimento de Young. com a luz incidindo perpendicularmente sobre 
o anteparo onde estão os dois orifícios, coloca-se uma lâmina delgada transparente 
de faces paralelas e índice de refração n sobre um dos dois orifícios. Isso produz 
um deslocamento de m franjas na figura de interferência (a franja central brilhante 
desloca-se para a posição que cra ocupada pela franja brilhante de ordem m). O 
comprimento de onda da luz é A. Qual é a espessura d da lâmina? 
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3. Para explicar as cores das manchas de óleo no asfalto molhado, considere 
uma camada de óleo, de índice de refração 1,5, boiando sobre a água (o asfalto 
absorve a luz transmitida através do óleo e da água). Suponha que a espessura da 
camada de óleo é igual ao comprimento de onda À, da luz violeta no ar, e que se 
observa a luz refletida na incidência perpendicular. (a) Mostre que há um mínimo 
de reflexão para luz violeta. (b) O comprimento de onda Àz da luz vermelha é 
aproximadamente o dobro: À: = 2 A. Mostre que para luz vermelha há um máximo 
de reflexão. 


4. Uma lâmina de água de sabão (índice de refração igual ao da água), colo- 
cada num aro vertical, escorre para baixo formando uma cunha. Observada por 
reflexão com luz de sódio (A = 5.890 À) incidente perpendicularmente, verifica se 
que há uma franja escura no topo e 4 franjas escuras por cm na lâmina. Qual é o 
ângulo de abertura da cunha (em radianos)? 

C E td gs 

` 5. Considere a experiência dos anéis 

de Newton, descrita na Seç. 3.3. Uma 

AR lente plano-convexa de raio de cur- 


i 
i 
1 
| jo 
1 
i 
i vatura R é colocada em contato com 
1 


uma placa plana de vidro e iluminada 


na incidência perpendicular (fig. ao 
lado). (a) Calcule a relação entre as dis- 
tâncias p e h da figura na vizinhança 
do ponto de contato O (h << R). (b) 
Calcule o raio py do m-ésimo anel escuro, 
visto na luz refletida, com luz monocro- 
mática de comprimento de onda À. 


6. Considere o experimento de Young 
com um feixe incidente | perpendicular 
ao anteparo À e um ponto P na direção 
8 do anteparo de observação O, onde a 
interferência: É construtiva. Se agora 
acrescentamos outro feixe incidente 2 que 
forma um ângulo A 8 com o feixe 1, e se 
formos aumentando A 6, chegaremos a 
uma situação onde a interferência em P é 
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destrutiva para o feixe 2, ou seja, os mínimos de 2 caem sobre os máximos de 1 e, 
se os dois feixes têm a mesma intensidade (e fregiiência), as franjas de interferên- 
cia desaparecem. Mostre que isso acontece para A O = 0,5 A/d, onde d é a se- 
paração das aberturas. Isso permite medir A 8. Relacione esse resultado com o 
interferômetro estelar de Michelson (Seç. 3.6). 


7. Para construir outro exemplo da relação entre largura temporal Ar e largura 
espectral A œ, considere o pacote de ondas [cf. (3.46)] 


E(f) ĵe 3º cos(o)do 


em que a amplitude da contribuição de 
freqüência o é exp |[-9/(AW)]. ou 
seja, tem largura espectral A © (fig.). Cal- 
cule E(r) e a largura temporal correspon- 
dente Ar. Comente o resultado. 


Sugestão: Para calcular a integral, 
integre por partes duas vezes. 


DIFRAÇÃO 


4.1 O conceito de difração 


Consideremos (fig. 4.1) um pequeno 
orifício circular num anteparo opaco, 
iluminado por um feixe paralelo de luz 
monocromática. 


Segundo a lei da propagação retilínea 
da ótica geométrica, o feixe transmi- 


Fig. 4.1 Difiação por um orificio circular tido através do orifício seria um cilin- 

dro circular, e formaria uma imagem 

brilhante idêntica ao orifício num anteparo de observação: fora desta região. a es- 
curidão seria completa (sombra geométrica). 

Já havia sido observado por Francesco Maria Grimaldi, num livro publicado 


postumamente em 1665, que. quando o orifício é muito pequeno, como um bu- 


raquinho de alfinete, e a distância R ao anteparo de observação é suficientemente 
grande, verifica-se que a luz penetra na região de sombra geométrica, com o apare- 
cimento de franjas claras e escuras na vizinhança do limite da sombra. 

Ess 


s desvios da propagação retilínea da luz foram chamados de difração, no- 
me ligado à “deflexão”dos raios luminosos. Nesse sentido genérico, tanto pode 


aplicar-se à passagem através de uma abertura como ao “espalhamento” por um 
obstáculo. 


Os fenômenos de difração 


como os de interferência, aos quais estão estrei- 
tamente ligados, são característicos de uma teoria ondulatória. Quanto maior o com- 
primento de onda em relação às dimensões da abertura ou obstáculo, mais fortes 
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devem ser os efeitos de difração: na experiência acima, luz vermelha sofre desvios 
maiores do que luz azul. Na acústica, onde os comprimentos de onda são da mesma 
ordem de grandeza que o tamanho dos objetos encontrados na propagação, os efei- 
tos de difração são muito fortes. 

É costume classificar os fenômenos de difração em duas categorias, conforme 
a distância R entre o “objeto difratante” e o anteparo de observação O. Para distân- 
ão excessivamente grandes (veremos depois os critérios), a agem” obser- 
vada preserva semelhança com a forma geométrica do objeto, embora apareça 
rodeada ou entremeada por franj 

Para R suficientemente grande (formalmente R — co), o resultado passa a de- 
pender somente da direção de observação, e não guarda mais semelhança com a 


claras e escuras. 


forma geométrica do objeto. Por exemplo, para um feixe paralelo incidente sobre 
uma abertura, a ótica geométrica prediz que a intensidade para R > o sóé*0 
na direção do feixe incidente, qualquer que seja a forma da abertura (circular, 
retangular ou irregular). Na teoria ondulatória, veremos que há uma dependência da 
forma da abertura, mas a figura de difração observada não é semelhante à forma 
geométrica da abertura, ao contrário do que sucede à distância finita. 

No primeiro caso, em que há uma semelhança perceptível, dizemos que se 
trata de difração de Fresnel; no segundo (R —> œ), de difração de Fraunhofer. 


A fig. 4.2 ilustra uma forma de obser- 
var na prática a difração de Fraunho- 
fer. Uma fonte de luz coerente F no 
plano focal objeto da lente Lı produz 


um feixe incidente paralelo, que atinge 


uma abertura num anteparo plano «À. 
Os feixes difratados em diferentes di- 
reções são coletados por outra lente 
Lo, que os focaliza em seu plano focal imagem, coincidente com o anteparo de 
observação ©. Os diferentes pontos P; , P2, ... representam imagens de direções di- 
ferentes, de forma que se observa sobre O a figura de difração de Fraunhofer. 


Fig. 42 Observação da difração de Fraunhofer 


Vamos concentrar a atenção principalmente na difração de Fraunhofer, que 
tem as aplicações mais importantes, limitando-nos a uma discussão qualitativa da 
difração de Fresnel. 


4.2 O Princípio de Huygens-Fresnel 


Vimos como Huygens deu uma explicação qualitativa da propagação retilf- 
nea baseada em ondas secundárias e na sua construção geométrica, sem considerar 
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ondas monocromáticas. Vimos também, na Seç. 3.2, como tratar o experimento de 


Young cônsiderando cada orifício como fonte de ondas e: 
ferir. 


ricas e fazendo-as inter- 


A idéia básica de Augustin Fresnel foi justamente combinar o princípio de 
Huygens com o conceito de interferência, aplicando-o à propagação de ondas mo- 
nocromáticas. As modificações básicas introduzidas por Fresnel no Princípio de 


Huygens foram então as seguintes: 
6) As ondas esféricas secundárias oriundas dos diferentes pontos de uma fren- 
te de onda são coerentes, pois a frente de onda é uma superfície de fase constante. 
(ii) A onda num ponto ulterior é a resultante da interferência de todas as 
ondas secundárias, levando em conta suas diferenças de fase associadas a percursos 
diferentes. 


Gii) A amplitude das ondas secundárias 
provenientes (fig. 4.3) de um elemento de 
superfície do de uma frente de onda E 


não é a mesma em todas direções: é má- 
xima na direção A normal à frente de on- 
da (direção do raio) e decresce lentamen- 
te e monotonicamente com o ângulo 
0'=Z(P'P,n). caindo a O para 


, E é 
Fig. 4.3 Princípio de Huygens-Fresne! 8 5 (ao longo da frente de onda). 


Assim, a contribuição de dg à onda no ponto P seria, segundo Fresnel, pro- 
porcionala do ca v (P^). a função de onda no ponto P’ do qual do é um entorno, 
contendo além disso um fator de obliquidade F (8’), máximo para 6 = 0 e ca- 
indo Jenta e monotonicamente para zero quando 6” > 1/2. 

A contribuição d y ( P) do elemento do no ponto P é portanto. segundo Fres- 
nel, 


dr) FE) do aD 


onde r = IP P1. 


A onda resultante em P é então” 


vE- [ar (=| FrEe) E as (42) 


onde. a integral é estendida a toda a porção não-obstruída de X: porções da 
frente de onda obstruídas por anteparos ou outros obstáculos opacos não con- 
tribuem, 


A (4.2) é a expressão analítica do Princípio de Huygens-Fresnel. Kirchhoff 
mostrou mais tarde que uma expressão desta forma pode ser obtida diretamente a 
partir da equação de ondas satisfeita por v, determinando assim a forma explícita 
do fator de obliquidade F (0). Entretanto, 


sto não será necessário por enquanto. 


4.3 O método das zonas de Fresnel 


Segundo o Princípio de Huygens-Fresnel (4.2), a função de onda em P é a 


resultante da interferência de todas as ondas es 


ricas secundárias provenientes dos 
pontos P’ de X. Sendo X uma frente de onda, a fase de v(P”) é constante sobre >. 
Logo, a fase de cada onda secundária é dada unicamente pelo fator de fase 
exp(ikr). correspondendo à defasagem kr. Tipicamente, kr >> 1 e explikr) varia 


rapidamente com P”. 


As contribuições dominantes nessa superposição de ondas devem então ser 
aquelas para as quais a interferência é a mais construtiva possível. Isto acontece 
num entorno de um ponto O de E no qual a fase seja estacionária, ou seja, varie 
o mínimo possível com a variação de P’. Este é um resultado geral na super- 
posição (interferência) de ondas. conhecido como o Princípio da Fase Estacio- 
nária. 


* Conforme a convenção adotada anteriormente, estamos omitindo o fator temporal e" sempre associado 
a ondas monocromáticas de frequência angular ©. 


/ 


Fig. 4,4 O pólo 
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No caso, kr é estacionário quando 
r= OP é mínimo, isto é, quando r é a 
distância do ponto de observação P à 
frente de onda E: O é portanto o pé da 
perpendicular traçada (fig. 44) de Pa E, e 
OP tem a direção da normal fia E em O. 
Isto significa que OP corresponde ao raio 
luminoso oriundo de E que passa por P, 
estabelecendo assim uma conexão com a 
ótica geométrica. O “ponto de fase esta- 


cionária” O chama-se o pólo da frente de 
vuda E relativo av ponto P. 


Vejamos agora de que forma o Princípio de Huygens-Fresnel explica a propa- 


gação retilínea da luz no espaço livre, aplicando-o à propagação de uma onda pla- 
na, com o auxílio de uma construção geométrica, o método das zonas de Fresnel. 


Fig. 4.5 Zonas de Fresnel 


Suponhamos então que v(P”) é uma onda plana que se propaga na direção z 


no espaço livre, 


v= Ag: (4.3) 


e tomemos como frente de onda È o plano z = 0, onde v (PJ) = A. A (4.2) fica 


re-a fre) ao 


| (4.4) 


onde Z é todo o plano z = 
O pólo O de F relativo a P é o pé da perpendicular de P a È (fig. 4.5), que 
= OP. Com centro em P, con- 


tomaremos como origem das coordenadas. Seja z 
sideremos uma série de esferas de raios 


s | (4.5) 
que cortam a frente de onda em círculos de raios (fig. 4.5) 
OA=p , OB-=p,, 0C=p,,.. (4.6) 
cujos valores podemos calcular nos triângulos retângulos POA, POB, POC, ... 
OA =PA -PO | p= 
OB -PE -PO 
e, para o círculo de raio pa 
=| (4.7) 


Vamos tomar 


>A (4.8) 
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Nesse caso, o último termo da (4.7) pode ser desprezado, o que dá 


Ro A 
[pa = Jnhz | G= LAA) (4.9) 
ou seja, os raios crescem como as raízes quadradas de números inteiros. 


Os círculos dividem o plano X numa série de anéis circulares concêntricos, 
que se chamam zonas de Fresnel. Por construção, sendo k = 27/A, 


kn 


q 
=e (+t) tzt 
2) 


kn=k(+A)=kz+27 


kr -kz=nr PE J (4.10) 
| i 


ou seja, a contribuição do ponto A à integral (4.4) está defasada de n em relação à 
do pólo O, a de B de 27 , a de C de 37... . Em média, a contribuição da 1.º zona 
de Fresnel interfere construtivamenie com as da 3º, 52,... e destrutivamente, 
com as da 2°, 4°, 63, 

A área da n-ésima zona de Fresnel é 


mẹ? -a)= hz] (4.11) 


ou seja, todas as zonas circulares têm aproximadamente a mesma área. 

Como tomamos z >> À, o fator de obliquidade ¥ ( 8 ) varia muito pouco sobre 
a n-ésima zona, e podemos tomá-lo sobre ela como tendo um valor constante Fp, 
onde, pelas hipóteses de Fresnel, F, é máximo para n = 1 e decresce lenta e mono- 
tonicamente quando n cresce, com 


(4.12) 


pois neste limite 6 — 7/2. 
Decompondo a integral numa série de integrais sobre as zonas sucessivas, a 
(4.4) dá então: 
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È O-A 5R, J as (4.13) 


Tomando coordenadas polares (p, q) no plano E, com origem em O, a inte- 
gral sobre a zona n vai de P„-ı à Pn - Como o integrando não depende de q, 


dc=2mpdp (área do anel entre p e p + dp) 


Mas r° = p? + z? , com z fixo, implica 
pdp = rdr [cama (4.1) 


e a (4.13) fica 


Mas, pela (4.10), km = kz + nt, e etf=(-1Y. 
Logo, 


v (P)= AA eis Š [ay -y7 tr 


r= 


Finalmente, 


| E 
v @)=2ira e" SE gl 
n=l 


(4.15) 
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confirmando que as zonas de Fresnel ímpares interferem entre si construtivamente, 
e destrutivamente com as pares. Esse era O objetivo da construção de Fresnel: todas 
as zonas têm a mesma área e há diferenças de caminho médias À / 2 entre duas 


zonas sucessivas. 
Para calcular a soma da série (4.15), o mais simples é usar um método gráfico, 


representando-a como uma soma de vetores colineares, cujos módulos decrescem 
lenta e monotonicamente para zero [cf.(4.12)], e que apontam sucessivamente em 


sentidos opostos (série alternada). 


` i 
i i 
1 
T 


So 
Ene, 


Para maior clareza, na fig. 4.6, os vetores 
foram deslocados sucessivamente na ver- 
tical. A resultante 
Tia Fy k Te Ptk CD Ey 
aponta da origem de F; para a extremi- 
dade de (—1 Ey e vemos pela simetria 
da figura que 


E af 
E KH =—H A, 
24 (4.16) 


A (4.15) fica portanto 


E E)=i AF Ae (417) 


Fig. 4.6 Soma gráfica da série alternada 


e o resultado, obtido por Fresnel, é que a interferência entre as contribuições das 
zonas sucessivas tem como efeito final em P a metade da contribuição da 1.º zona. 


Como a (4.17) deve ser igual à (4.3), concluímos que 


e o Princípio de Huygens-Fresnel (4.2) assume a forma mais explícita 


(4.18) 


=} =rF@=0) 


ik 


É = 5 f, Epe) 40 


(4.19) 
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onde f(8') é agora um fator adimensional, =1 para 0’ = 0 , e que > O lenta e 
monotonicamente para 8” — & 


Uma função com essas propriedades é 


f(e)= cos” | (4.20) 
o que daria 
vE) =+ fese veado] (421) 
| ad r | 
onde 7 = IPP'L 6 = Z (PP? , D) e né o versor da normal a E em P’, no sen- 


tido da propagação. 

A (4.21) é a forma explícita do PRINCÍPIO de HUYGENS-FRESNEL. Quan- 
do X é uma superfície plana, foi demonstrado por Rayleigh que este resultado de- 
corre diretamente da equação de ondas escalares, a única aproximação sendo que a 
distância r é muito maior que o comprimento de onda À. 

Na prática, porém, isso só permite calcular v (P ) se já conhecermos seus valo- 
res v(P”) sobre I, o que em geral não acontece. 

Entretanto, na teoria clássica da difração, estuda-se em geral a difração por 
uma ou mais aberturas num anteparo plano opaco, nas seguintes condições: 

G) As dimensões das aberturas são muito maiores que À. 

(ii) As distâncias do ponto de observação P e da fonte F ao plano do anteparo 
são muito maiores do que À e usualmente também muito maiores que as dimen- 
sões das aberturas. 

Nessas condições (fig. 4.7). a onda incidente tem uma frente de onda aproxi- 
madamente plana ao atingir o anteparo, e 
a maior parte da intensidade deve ser 
projetada na direção dianteira. Se tomar- 
mos então para E uma superfície plana si- 
tuada logo após o anteparo, e chamarmos 
de $ as porções de X situadas na sombra 
geométrica e de A (abertura) as demais 
porções, esperamos que v(P”) sobre È 
não difira muito da distribuição que seria 
Fig. 47 Justificativa da aproximação de Kirchhof prevista pela ótica geométrica, ou seja, 
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i a 
| v) = va (P) (onda incidente) sobre A | 

| | (4.22) 
| 


v(P)=0 (sombra geométrica) sobre S | 
na 


Essa foi a aproximação empregada por Kirchhoff em seu tratamento da di- 
fração. Levando-a na (4.21), obtemos um resultado inteiramente determinado: 


l der 
| lr E 
Ie j=- EA cos 8’ vg P)—as | (4.23) 
| 4 | 
i 


onde a integral se estende somente à abertura A c v(P?) é a onda incidente 
sobre A. 

Os resultados da teoria de Kirchhoff da difração, baseados na (4.23), estão em 
bom acordo com a experiência, na região onde os efeitos de difração se observam 
usualmente, ou seja, desde que o ponto observação P esteja na vizinhança do limite 
da sombra geométrica. Quando P penetra muito profundamente na sombra, a inten- 


sidade se torna muito pequena e em geral não é observada. 


4.4 Difração de Fresnel: discussão qualitativa 


O método das zonas de Fresnel permite compreender de forma qualitativa a 
formação da sombra geométrica e o aparecimento das franjas de difração que se 


observam na vizinhança do limite entre a sombra geométrica e a região iluminada 
(figura de difração de Fresnel). 

Para ver isso, consideremos uma abertura A de forma qualquer num anteparo 
plano opaco, iluminada por uma fonte puntiforme F situada a uma distância finita, 
e procuremos estimar o comportamento da intensidade em diferentes pontos de ob- 
servação, somando as contribuições das zonas de Fresnel a eles associadas, como 
método de cálculo da (4.23) análogo ao que empregamos para uma onda plana no 
espaço livre. 

O caminho de fase estacionária entre a fonte F e o ponto de observação é a 
reta que une esses dois pontos, e a intersecção des: 


reta com o plano do anteparo 
éo pólo relativo ao ponto de observação, que é também o centro do sistema de 
zonas de Fresnel correspondente. 
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Fig. 48 Pólos relativos a diferentes pontos 
de observação 


Fig. 4.9/a) Zonas də Fresnel para P4 


a intensidade em P, (parte central da 
que se o anteparo não existisse 


Fig. 4.9b) Zonas de Fresnel para Pz 


= o 
> 
er 
e 
nema 
penas, 
DEES 
AA 
e 

pl 


A fig. 4.8 mostra a fonte F e cin- 
co pontos de observação Pr... 
com P; próximo à parte central da re- 
gião iluminada, Ps já bem dentro da 


sombra geométrica, P4 no limite da 
sombra e P; perto desse limite. para 
uma abertura A de forma qualquer. Os 
pontos Oj,..., Os são os pólos corres- 
pondentes, intersecções de FP; , ..- , FPs 


com o plano S + A. 


A fig. 4.9(a) mostra o sistema de zo- 
nas de Fresnel não obstruídas com 
centro em Oy, na região central de 4, e 
a soma de vetores correspondentes. A 
única mudança com respeito ao espaço 
livre é que as últimas zonas de Fresnel 
descobertas dão uma contribuição irre- 
gular, mas já muito pequena, de modo 
que a resultante R é ainda muito pró- 
xima de 1 F; , como na (4.16). Logo, 


região iluminada) é praticamente a mesma 


Para P», o pólo O» já se aproxima da 
beirada de A. Na fig. 4.9(b), as duas 
primeiras zonas estão descobertas, mas 
as seguintes já vão sendo obstruídas, e 
R é bastante < a 

Logo, temos uma franja escura, embo- 
ra P ainda esteja na região iluminada 
da ótica geométrica. 
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s Em P; [fig. 4.9(c)], o pólo O; é tal que 
= a a Es ð 
> a 1.7 zona está descoberta, mas as 
Era ; ne 5 
m seguintes já vão sendo cada vez mais 
= G è sat 
m obstruídas. A resultante R é > 4 Fi, 
E 2 
4 de forma que se tem uma franja clara 
FEH a o, 
pen na região iluminada (perto da tran- 
sição para a sombra) mais intensa do 
Fig. 4.9(c) Zonas de Fresnel para P3 que existiria na propagação livre. 


O ponto P; está no limite da sombra 
geométrica. de forma que o pólo cor- 
respondente O. cai no contorno da a- 
bertura [fig. 4.9(d)]. A resultante é da 
ordem de uma parie da fração exposta 
da primeira zona. Logo, a intensidade 
não cai descontinuamente para zero no 
limite da sombra, como prevê a ótica 
geométrica: há um decréscimo gradual 


me 
~= 
= 


Fig. 4.9(d) Zonas de Fresnel para P4 dernensidade: 


Finalmente, em Ps, já bem dentro da 
sombra geométrica. o pólo Os cai so- 
bre o anteparo opaco. longe da aber- 
tura A [fig. 4.9(e)]. A primeira e a 
última frações de zona expostas con- 


tribuem muito pouco, e a resultante é 


muito pequena (a intensidade varia 


com R? ). Logo, temos escuridão 
quase completa, aproximando o resul- 


Fig. 4.9(e) Zonas de Fresnel para P5 adôdasóiica cedmétiica: 


Para pontos como P; e Ps, os resultados dependem muito pouco da forma da 


abertura, justificando a validade da propagação retilínea (ótica geométrica) como 
muito boa aproximação. Para pontos como P», Ps, Ps, mais próximos da transição 


luz/sombra, aparecem franjas claras e escuras que dependem mais da forma da 


abertura, correspondendo à oscilação periódica com as porções de zonas que vão 
sendo obstruídas. 
Admitimos na discussão acima que a abertura contém muitas zonas de Fres- 


nel. e vimos que os resultados guardam uma relação de semelhança com a forma 


geométrica da abertura, o que, na classificação da Seç. 4.1, caracteriza a região de 
difração de Fresnel. 

Conforme vimos no exemplo da (4.1), os raios das zonas de Fresnel crescem à 
medida que o ponto de observação P se afasta da abertura. Quando a distância se 
torna suficientemente grande para que a abertura toda esteja contida dentro de 
uma zona de Fresnel, entramos na região de difração de Fraunhofer e a figura de 
difração, conforme veremos, deixa de ter semelhança geométrica com a forma da 
abertura A. 

Outra condição que admitimos no tratamento acima foi que a primeira e a 
última zona expostas no contorno de A dão contribuições muito pequenas. Isso po- 
de não ser válido para formas especialmente simétricas de A e/ou para posições 
especiais do ponto de observação P, conforme ilustrado pelos exemplos seguintes. 


Exemplo 4.1: Difração de Fresnel no eixo de uma abertura circular 


Este é um caso de exceção devido à 
simetria especial. Conforme mostra a 
fig. 4.10, para um ponto de observa- 
ção P sobre o eixo de uma abertura 
circular (e uma onda incidente plana 
perpendicular ao anteparo). o pólo O 
coincide com o centro da abertura, de 
forma que o contorno da abertura pode 
coincidir com o contorno de uma zona 
de Fresnel, dependendo da distância 
OP = z [cf. (fig. 4.9)1. 


Fig. 4.10 Zonas de Fresnel no eixo 
de uma abertura circular 


Se o número de zonas de Fresnel que caem dentro da abertura é um inteiro 
ímpar, como na fig. 4.10, a resultante R é muito próxima de F;, de modo que a 
intensidade em P é da ordem de 4 vezes a intensidade da onda incidente. Por outro 
lado, se é um inteiro par, a resultante é = O, de forma que a intensidade prati- 
camente se anula, embora o ponto de observação esteja dentro da região iluminada. 
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Se a é o raio da abertura, o número de zonas de Fresnel nela contido é o 
maior inteiro contido em 


(4.24) 


que varia com a distância z. Portanto. a intensidade ao longo do eixo oscila entre 
os valores extremos acima: ~ 44% (onde fo é a intensidade incidente) e 0. 

Se o ponto de observação P se afasta do eixo. este efeito se torna rapidamente 
menos pronunciado (verifique!): a figura de difração, por simetria, tem a forma de 
anéis concêntricos. 


Exemplo 4.2. Lente de Fresnel 


Para um dado ponto de observação, que 
acontece se bloquearmos (tornando-as 
opacas) todas as zonas de Fresnel pares 
(fig. 4.11). deixando desobstruídas ape- 
nas as ímpares? 

Conforme resulta da fig. 4.6, as contri- 
buições de todas as zonas descobertas 
interferem então consirutivamente. Se o 
número delas é N, a resultante é = NA, 
e a intensidade é = 4N?h , onde Io é a 
intensidade incidente. Para N grande, 


sim uma forte concen- 


podemos obter a: 

RES, Cio era tação de intensidade em P, onde P está 

no eixo de simetria; para P fora do eixo, a intensidade cai rapidamente, mostrando 
que se trata de um efeito de focalização. 

Um efeito correspondente ocorre para uma onda incidente esférica, originária 
de uma fonte F puntiforme, definindo de forma análoga as zonas de Fresnel. Existe 
nesse caso uma fórmula semelhante à das lentes delgadas, relacionando as distân- 
cias da fonte e do “ponto imagem” P ao pólo O. A demonstração será deixada para 
os problemas (Probl.4.3). 

Na prática, a “lente” de Fresnel é uma réplica fotográfica reduzida de uma 
figura como a fig. 4.11. 


Consideremos agora um pequeno dis- 
co circular opaco iluminado por uma 
onda plana incidente perpendicular- 


mente sobre ele, e um ponto de obser- 


> vação P situado sobre o eixo de sime- 
tria (fig. 4.12). 
A partir da primeira zona de Fresnel 
que estiver descoberta, as contribui- 
ções são as mesmas que na propaga- 
çao livre de uma onda plana (Seç. 
4.3). Como o disco é suposto pequeno, 
o fator de inclinação não afeta substancialmente essas primeiras contribuições. Lo- 
go. o resultado quase não difere do que se obtém para uma onda plana, no espaço 
livre, Numa pequena vizinhança do ponto P, quando nos afastamos do eixo, a in- 
tensidade continua próxima da da onda incidente, mas tende a cair rapidamente por 


Fig. 4,12 Ponto no eixo da um disco circular 


razões análogas às que vimos ao explicar a formação da sombra geométrica 

Logo, bem no centro da sombra geométrica de um disco opaco circular, deve 
existir uma pequena mancha brilhante, com a intensidade da onda incidente. A 
razão é que, devido à especial simetria, há interferência construtiva das ondas 
cundárias num tal ponto. 


"A 


A teoria de Fresnel da difração foi primeiro apresentada numa memória encami- 
nhada à Academia de Ciências de Paris para concorrer a um prêmio. destinado a quem 
melhor conseguisse explicar os efeitos de difração. Um dos membros da comissão 
julgadora era o matemático Siméon Denis Poisson, partidário da teoria corpuscular. 

Poisson percebeu que uma das consequências da teoria de Fresnel seria a existên- 
cia dessa mancha brilhante no centro da sombra de um disco circular, o que lhe 
pareceu absurdo, e levantou esta objeção ao trabalho apresentado 

Com a ajuda do físico François Arago, Fresnel conseguiu realizar a experiência, 
mostrando que a mancha brilhante efetivamente aparecia. Fresnel ganhou o prêmio. 
Entretanto, a mancha brilhante passou a ser conhecida como a mancha de Poisson! 


4.5 Difração de Fraunhofer 


Vimos na Seç. 4.1 que, para uma distância R “suficientemente grande” do 
ponto de observação P à abertura A, entra-se na região de difração de Fraunhofer, 


onde a figura de difração corresponde à variação da intensidade com a direção de 
observação: vimos também como ela pode ser observada, com o auxílio de lentes. 

O que é “suficientemente grande”? É uma distância para a qual não mais se 
observam os efeitos de difração de Fresnel, por ser o diâmeiro máximo D da aber- 
tura A muito menor que o raio da primeira zona de Fresnel, de modo que a abertura 
compreende apenas uma fração de uma zona de Fresnel. 


A condição para que isso aconteça |cf.(4.24)] é que seja 


aspst2s2sa (4.25) 
D 2 


Por exemplo, para D ~ 0.5mm €e À ~ 5 x 107cm , isto dá R >> 0.5m . Na 
prática, a observação no plano focal imagem de uma lente (fig. 4.2) equivale a 
fazer R — es, de forma que esta condição é satisfeita. 


Vamos agora (fig. 4.13) tomar a 

t origem num ponto O fixo da abertura 
A a 

A. Se tb É o versor da direção de pro- 


pagação da onda plana incidente, e P” 


a Rd um ponto de A, com OP” = x, temos, 
| na (4.23). 


ù, 
AG sj - 
“= dE , =kã 
“A 
l 
= Amplitude incidente 
Fig. 4.13 Difração de Fraunhofer 
(4.26) 
Por outro lado, com OP = Re PP = y, a fig. 4.13 dá, para R > “o”, 
red 5 (427) 


Projeção de OP” sobre OP 


onde à é o versor da direção de observação OP. 
Como na Seç. 3.2, podemos substituir r por R no denominador de exp (ikr) / r 
(onda esférica que se propaga de P” a P), mas não no numerador, pois a fase kr da 
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exponencial varia bastante dentro da abertura, cujo diâmetro D é >> À. Logo, a 
(4.27) dá 


f 
S- E exp E (R-à- 2) | (4.28) 


Substituindo as (4.26) e (4.28) na expressão (4.23) do Princípio de Huygens-Fres- 
nel-Kirchhoff, obtemos 


i ma Pa) 
x(P)= = | cosb aged. > dx 
B-a | 8 R 


onde usamos a notação d? x” para o elemento do de superfície sobre A. 

O fator de obliguidade cos 9” também varia muito pouco sobre A: como a 
maior parte da intensidade irá para direções próximas de to. podemos substituí-lo 
por cos dy, onde Bo é o ângulo entre a direção incidente e a normal ao plano de A 
(fig. 4.13). Finalmente, fica 


é CÊ fita) . 
A (4.29) 
R f | 


onde 


k=zû]| (4.30) 


seria o vetor de onda de uma onda plana que se propagasse na direção de obser- 
A 
vação u. 


Podemos reescrever a (4.29) da seguinte forma: 


vP) = a LOEDE (431) 


onde 


Jâ, û)= 2i [A Py (4.32) 
L 
a 


A interpret: 


ão física desses resultados é simples. A (4.31) representa uma 
onda esférica emanada da abertura, cuja única dependência da distância é dada 
pelo fator exp(ik R) / R de propagação da onda esférica. Isso concorda com a 
expectativa de que, vista desde uma distância suficientemente grande, a abertura 
deve aparecer como uma fonte puntiforme 

Entretanto, a amplitude da onda esférica (proporcional à amplitude & da onda 
incidente) depende das direções de incidência fp e de observação à, através do 
fator f(k, 0, 0o), que representa a amplitude de difração na direção U. Isso também 
concorda com o que foi dito na Seç. 4.1: a figura de difração de Fraunhofer só 


depende das direções, embora a intensidade caia com 1/ R e 


A (432) também tem uma interpreta- 
cão física imediata. Com efeito (fig. 
4.14), seja P;P'P/ um percurso com 
incidência segundo Pı PV) e di- 
fratado na direção P'P, '( //0), o que 
dá origem a uma contribuição à inte- 
gral (4.32). Consideremos o percurso 
paralelo Py OPo” (fig. 4.14). passando 
pela origem O (fixa). 


A diferença de caminho entre esses 
dois percursos é 


Fig. 4.14 Diferença de caminho 


BP-OC=to-x-d-x=(i,-6)x| (4.33) 


ea diferença de fase correspondente é EC - à) ER co 

Logo, a integral na (4.32) é o fator de interferência, que leva em conta as 
diferenças de fase na superposição das contribuições dos diferentes pontos P’ da 
abertura. Note que as lentes L; e Ls no dispositivo de observação da fig. 4.2 não 
introduzem defasagens adicionais nos trajetos até os focos, pois, pelo Princípio de 
Fermat, os caminhos óticos entre as frentes de onda OB e CP’ da fig. 4.14 e os 


focos são iguais. 
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à E ava , NERS. 2, E: 
A intensidade máxima se obtém na direção u = W, para a qual a interferência 


é construtiva (direção de propagação geométrica), e é dada por 


x à as cos 0, z _ cos6 ; 
AGO TJ du - o, (4.34) 


onde Ga é a área da abertura A. 
Em geral, interessa-nos a distribuição relativa da amplitude, comparada com 
seu máximo para U = t, que, pelas (4.32) e (4.34), é dada por 


f&.â) 
Fido) 


onde simplificamos a notação. A razão das intensidades é o módulo ao quadrado 
da razão das amplitudes: 


| rà) 1 
KORD 


E “dx | 


a 


Podemos simplificar ainda mais o resultado limitando-nos ao caso da incidência 
perpendicular ao anteparo, em que 


[Mo (4.37) 
Nesse caso,vem 
“Oo [| 
EOR ~ “dx | (4.38) 


bastando levar em conta as defasagens associadas aos raios difratados na direção 
É nie A A A 
u [compare com a (4.28)]. O caso geral obtém-se substituindo U —> u- ib. 
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4.6 Abertura retangular 


Consideremos uma abertura retangular 
de lados 2a e 2b num anteparo opaco. 
iluminada perpendicularmente por uma 
onda plana. Tomemos a origem O no 
centro do retângulo (plano z = 0, fig 
4.15). Sejam (o. B. y) os cosenos di- 
setores da direção de ubscivação. 
ù= tapy): k= 40. Temos então. 
com x’ =(x'.y'.0) na (4.38). 


a b 


fenes Prs fa ř Jay 


a w 5 


Jina _ ikas f aie pAtBo % 
(s = [: a ET sen (k a a) sen (k B b) 


e o = (2a) (2b) = 4ab, de forma que 


1 ja Egs sen (ke) sen(kBb) do 


Ss E G aa) (Bb) 


A 


e resulta [cf.(4.38)] 


l 1(6) sen? X seno’ yo. 


s 4.40 
| I,) x | i 

onde 
a JA GAD 


Se tivéssemos incidência numa direção qualquer, to = ( œ , Bo, Yo); a única 
diferença seria a substituição: & —> q — 00,8 — P — Bo na (4.41) [ef.(4.36)]. 

O gráfico da função sen? v/v” foi representado na fig. 3.19. É uma função 
par de y, que se anula nos pontos w= nm (n=1,2,..)eé= 1 (máximo prin- 
cipal) em v = 0. 


serv 
E 
1 
ri 0,017 0,008 
i | 

a $- 
= ATA, je Nu peso > y 
-4n 3% -2n -n o T 2x | 3x | 4x 


1,481 2460 347% 


2 
Fig. 4.16 A função SE 


Ele está novamente reproduzido na fig. 4.16, onde foram indicadas as posições 
dos máximos secundários, que vão se aproximando de (n + $)7 , e os valores da 
e a i g 2 
função nesses máximos, que caem rapidamente, devido ao fator 1/v*. 
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aa fonaoo Pela (4.40). a figura de difração éo 
1,7 10.08/0.03001 produto de dois fatores desse tipo. A 


4;7 lo22/o,08/0.04| intensidade se anula em 


| | n = = 2 
«logtaztaz-ago-tazazos & REENEN EENAA 


i i | m=i, 
i aT | | é 
F 17 ji | 
| - : Ba = mT/Ckb) = mÃ/() 
08 [ 


(m=1.,2...) 
Fig. 4.17 Figura de difração de uma o que define uma rede de retângulos 
aberiura retangular de dimensões inversamente propor- 
cionais às da abertura (fig. 4.17, onde 

a abertura é o retângulo hachurado à esquerda). 

Usando os valores de sen? v/v” nos máximos, foram colocados nos centros de 
retângulos da fig. 4.17 os valores máximos da intensidade em cada retângulo, nor- 
malizados ao valor 100 no centro da figura (o. = B = 0); na ótica geométrica, a 
intensidade só seria # O neste ponto central, que representa a direção de incidência. 

Os valores decrescem rapidamente fora dos braços da cruz central: a figura de 
difração tem o aspecto de uma cruz luminosa, com os braços sulcados por franjas 
escuras. 

A semi-abertura angular de cada braço da cruz é inversamente proporcional 
ao lado do retângulo que lhe deu origem: 


AQ -7a , Ape 2 7 (2b) (442) 


Assim, quanto mais estreito for um lado do retângulo, mais largo o feixe di- 
fratado na direção correspondente, o que concorda com a idéia de que os efeitos de 
difração crescem com a razão À /(dimensões). 

Pela fig. 4.15, vemos que as (4.42) também definem os leques de valores de 
k: e k, encontrados na onda difratada (domínio varrido pelo vetor k), e temos 


„Ak, =kab= i] (4.43) 


ou ainda, usando as notações Ax =2a , Ay 


2b para as larguras da abertura, 


Ak,Ax=27:Ak,Ay=27 (444) 
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o que justifica a relação Akı Ad: ~ 2x empregada na discussão da coerência 
transversal [cf. (3.52)]. 


Não é apenas uma abertura retangular 
que produz “leques” de luz difratada. 
Isso vale para qualquer abertura de forma 
poligonal, com os braços dos leques per- 
pendiculares aos lados do polígono. As- 
sim. uma abertura triangular produz um 
leque de 6 braços (fig. 4.18). 

| É devido a pequenas irregularidades 
nas íris dos nossos olhos que vemos as 


4 À estrelas com “pontas”. Sem essas irregu- 

laridades, veríamos a figura de difração 

Fig. 4.18 Figura de difração de uma de um orifício circular, formada de anéis 
abertura triangular concêntricos (cf. Seç. 4.8). 


4.7 Difração de Fraunhofer por uma fenda 


Uma fenda é um retângulo em que um dos lados é >> que o outro, de forma 
que sua figura de difração é um caso particular da que foi discutida na Seç. 4.6, 
com (p. ex.) 


b>a (4.45) 


e ma 
| ma Na figura de difração da abertura re- 


=a 

my 

ma tangular. se formos aumentando b, a 
figura de difração na direção P vai-se 

= contraindo, até reduzir-se praticamente 

ao máximo principal B=0 (ou 

B = Bo se Bo < O para a direção de in- 

cidência). Assim, a figura de difração 


da fenda é uma linha luminosa orien- 
tada na direção L à fenda e modulada 


$ em à pelo fator sen CANA. 
Fig. 4.19 Difração por uma fenda 
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Em lugar de uma única direção de incidência Oo, costuma-se iluminar a fenda 
por um feixe de direções, em que (p. ex.) Bo varia entre 2 limites, + By, bastante 
amplos, constituindo uma fonte linear. 

Para isto, no dispositivo ilustrado na fig. 4.2, basta substituir a fonte punti- 
forme F no plano focal objeto da lente Lı por uma fenda paralela à fenda objeto, 
iluminada de forma incoerente (fenda-fonte extensa). Cada ponto dela produz uma 
figura de difração tipo linha luminosa (fig. 4.19, onde as lentes não foram repre- 
sentadas), € a incoerência das fontes F;,F5,Fs... implica que as intensidades das 
figuras de difração respectivas se somam. Figuras oriundas de pontos-fonte adja- 
centes se justapõem, dando origem a uma série de faixas claras e escuras paralelas 
ao lado maior da fenda. 

Analiticamente, isso equivale a integrar (somar) as intensidades obtidas para O 
retângulo, onde P — B — Bo, em relação a Bo , entre os limites + Bı , o que, 
para Y=kb(B — Bo), leva a [cf.(4.40)] 


per £ 


yF 


dY 


onde supomos Y; suficientemente grande para abarcar o pico central da curva (fig. 


4.16) e vários picos laterais. O resultado é uma constante praticamente inde- 
pendente de P , de forma que se obtém, da (4.40), 


1 siy) 
HO (4.46) 


onde X = kao [ou ka(& — 0), para do + 0]. 
Esse resultado também poderia ter sido obtido de uma versão simplificada da 
(4.35), válida para uma fonte linear incoerente do tipo descrito acima: 


A ere qu L fest qu) (447) 
2044 2a 


a 


fka) E 
E) 


onde a área o, da abertura é substituída pela largura 2a da fenda. 


Vemos na fig. 4.20 que o coseno di- 
A 
retor do ângulo entre u e Ox é 


a = cos (E = o) =senð (448) 


t 


onda de modo que (tomando ©% = 0) 


incid. 


|x = kaa = kasma =k- (08) 


(4.49) 


é a diferença de fase entre um raio difra- 
tado que passa pelo centro O da fenda e 
Fig. 4.20 Diferença de fase outro que passa pelo extremo superior B. 


Se essa diferença for = 7, as contribuições de B e de O se cancelam por inter- 
ferência destrutiva, e o mesmo acontece com cada par de elementos dx” distantes 
de a um do outro na metade superior e na metade inferior da fenda. Isso explica 
por que X = kag = t n é uma linha nodal (franja escura) da figura de difração. 

Se a diferença de fase for = n n, basta subdividir a fenda em 27 partes iguais 
e repetir o raciocínio para cada par de partes adjacentes. Interpretam-se assim os 
zeros de intensidade da figura de difração da fenda. 


O pico central de difração contém ~ 91% 

da intensidade, de forma que sua abertura 

| DO cá angular define a abertura angular do feixe 
«+ ss cifratado. Para 


2a lag 2a - ImmeA=5x10%cm 

é Àà/(2a) = 5 x 107 rad, de modo que 
podemos tomar sen 6 = 6 e concluir que, 
após passar pela fenda, um feixe inciden- 


te paralelo adquire (na região de Fraun- 
hofer) uma abertura angular (fig. 4.21) 


Fig. 4.21 Abertura angular 


Ea! 


A 
apa E=— (4.50) 


4.8 Poertura orcubr. Pode 


4.8 Abertura circular. Poder separador 


p Para uma abertura circular de raio a, com 
incidência perpendicular, a figura de di- 
fração é simétrica em torno de Oz (fig. 
4.22), de modo que podemos, sem restri- 


| 


ção da generalidade, tomar ino plano *z, 
ea e tomar coordenadas polares com origem no 
centro da abertura para x’, na (4.38): 
Fig. 4.22 Abertura circular 
à = Qen 8,0, cos) 
Ù- x’ =p senð coso 
= (e cos P,p sen 9,0) 
x =pdpdo 


o que dá 


a ar 
gts [oap C (451) 
o o 


ec = Ra’ na (4.38). 

A integral (4.51) não se reduz a uma função elementar, como aconteceu com 
a (4.47). Ela se exprime em termos de uma função Jı (u) chamada “função de 
Bessel de ordem um”, levando a 


A AJ (uu 


| | (kason 3] | 


O. 
af kasen 8 


~ 


= 


Entretanto, não será necessário conhecer 
mais do que as propriedades qualitativas 
dessa função, que são muito semelhantes 


às da função sen? # /u”, como se vê pelo 
gráfico da fig. 4.23. 


Fig. 423 Gráfico da (4.52) 


A maior parte da intensidade vai para 
o pico central (~ 84%), que corres- 
ponde ao disco central brilhante da fi- 
gura de difração, rodeado de anéis 
concêntricos (fig. 4.24) escuros e cla- 
ros (mas bem mais pálidos). 


O pico de difração dianteiro tem 


uma abertura angular dada por (cf. fig. 
Fig. 4.24 Figura de difração de uma 423) 
abertura circular pd 


ka sen ð = Z asno = 1227 


o que dá 


Í 
| ” 
[seno ~ A0 =0,612] (4.53) 
a 


resultado devido a Ai 


que tem aplicações importantes no cálculo do poder sepa- 


rador de instrumentos óticos. 


Num instrumento ótico, a luz proveniente de um ponto do objeto atravessa em 
geral uma série de aberturas circulares: diafragmas, lentes, ete.. Mesmo corrigindo 
da melhor forma possível as aberraçõ 


ão fundamental imposta pela difração nas aberturas circulares atra- 


a imagem de um ponto não é puntiforme, 


devido à limita 


vessadas. 

Podemos tomar como imagem de um ponto fonte o disco central de difração, 
de abertura angular dada pela (4.53). 

Se dois pontos do objeto estiverem muito próximos, os discos centrais de di- 
fração nas imagens dos dois pontos se sobrepõem: vemos então uma só mancha 


luminosa, não conseguindo distingui-los. 


Não adianta nesse caso ampliar a ima- 
gem: por mais que se amplie, não separaremos um ponto do outro. 

O critério de Rayleigh, empregado na definição do poder separador, é análogo 
ao da fig. 3.16: para que as imagens de dois pontos incoerentes possam ser se- 
paradas. basta que o máximo central de difração associado a uma delas coincida 


com o 1º mínimo da outra. 
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A fi 


gráficos de intensidade e dos discos de 


g. 4.25 mostra, em termos dos 


difração, as imagens de dois pontos que 
estão no limite do poder separador. 

No caso do telescópio, o que interes- 
sa é a separação angular mínima entre 
dois pontos luminosos (estrela dupla, p. 
ex.) que ainda permite distingui-los. Essa 
separação A 6 é dada pela fórmula de Ai- 
ry (4.53), onde a é o raio da objetiva do 
telescópio, que produz a imagem. A fun- 


Fig. 4.25 Limite do puder separador z : 
ção da ocular, como vimos na Seç. 2.9, é 


apenas produzir um aumento angular suficiente da imagem. É por essa razão que 
se constróem telescópios com objetivas de raio grande. 

Vemos também que o poder separador é diretamente proporcional ao compri- 
mento de onda, Essa é a principal limitação de um microscópio ótico. A razão pela 
qual se conseguem aumentos bem mais elevados com um microscópio eletrônico é 
a redução do comprimento de onda: discutiremos na física quântica como associar 
um comprimento de onda aos elétrons. 


O Princípio de Babinet 


Dizemos que dois dispositivos de di- 
fração associados a um anteparo plano 


—> 
” são complementares quando o que é 
— abertura num deles é parte do anteparo 


opaco no outro. Exemplo: a difração por 


uma abertura circular de raio a num 

Fig. 4.26 Dispositivos complementares anteparo plano: e adimagao pr üi 

disco circular opaco de raio a (fig. 

4.26). Se chamarmos de S a parte opaca do anteparo e 4 a abertura, como na fig. 
4.7, os dois dispositivos diferem pela troca S & A. 

Se chamarmos de v4 a função de onda difratada pela abertura e de vs aquela 

correspondente ao arranjo complementar, o princípio de Huygens-Fresnel na apro- 


ximação de Kirchhoff (4.23) mostra que 
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Mas S + A é o plano E completo. Logo, pela (4.21), 


v, @)+ vs (P) = v (P) (4.54) 


ou seja, a soma das ondas difratadas em P por dois dispositivos complementares é 
igual à onda incidente em P propagada livremente (sem anteparo). Esse é o prin- 
cípio de Babinet. 

Uma consequência importante desse princípio é sua aplicação à difração de 
Fraunhofer. Nesse caso, o ponto P está a grande distância, numa direção ù e 
temos 


nP)=0 (f=ã) (R >“ (4:55) 


pois a onda plana incidente só contribui na sua direção de propagação (ponto cen- 
tral da figura de difração). 
Logo, a (4.54) dá 


v) = = Œ) 


G = â) (4.56) 


+ 1(u0)=+ (0) 


pois a intensidade 7 = | v Ë. 

Portanto, exceto na direção de propagação, as figuras de difração de Fraun- 
hofer associadas a dois dispositivos complementares são iguais. 

A figura de difração de Fraunhofer de um disco circular é portanto a mesma 
que a de uma abertura circular de mesmo raio, ou seja, é formada de anéis circu- 
lares concêntricos 


113 


Fig. 4.27 Difração por uma esfera 


Ainda dentro do domínio de aplicabilidade da aproximação de Kirchhoff, a 
figura de difração de Fraunhofer de um disco circular de raio a também coincide 
com aquela associada a uma esfera (fig. 4.27) de raio a, pois ambas bloqueiam a 
mesma porção circular da onda incidente. 

Logo, uma partícula esférica também produz um pico de difração dianteiro, de 
abertura angular dada pela (4.53), rodeado de anéis concêntricos. Ao longo do eixo 
de simetria, esse pico é um prolongamento da mancha brilhante de Poisson encon- 
trada na região de Fresnel. 

As coroas de difração vistas em torno da Lua são devidas à difração por gotí- 
culas de água esféricas nas nuvens. Cada gotinha produz sua figura de difração e 
as intensidades se superpõem (fontes incoerentes). O diâmetro angular típico é al- 
gumas vezes o diâmetro angular da Lua, que é de = 0,57 Tomando A8 ~ 37 ~ + 
rad, e À ~ 5 x 107cm = 0,5 um, a (4.53) mostra que o raio médio das gotinhas é 
da ordem de uma dezena de um. A beirada externa das coroas é avermelhada, 
mostrando que se trata de um efeito de difração: o vermelho é mais fortemente 
desviado do que o azul. 


4.9 Par de fendas e rede de difração 


Consideremos agora a difração de Fraun- 
hofer por um par de fendas (fig. 4.28) de 
mesma largura 2a, cujos centros O e O” 
estão separados por uma distância d (to- 
mamos O como origem). 


d-a 

= gu d 
A 

— q 
a 


| fenda paralela às consideradas, como na 
fig. 4.19. 


Vamos tomar como dispositivo de ilumi- 
nação uma fonte linear incoerente, obtida 


iluminando por uma fonte extensa uma 


Fig. 4.28 Par de fendas 
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Nesse caso, podemos aplicar a versão simplificada, análoga à (4.47), dos re- 
sultados anteriores: 


a d+a | 
Era efjerssaxa entes (4.57) 
g ] 


| &.a)= 


4 


onde, para simplificar, tomamos incidência L e C é a constante de normalização. 


Com a mudança de variável x" = d + x na 2º integral, vem 


dta a 
paeis a eften apina da (4.58) 
da Ja 

e a (4.57) fica 

iJ. a)= f k.a) Ê T ibi ] | (4.59) 


onde fi (k.œ) é a amplitude de Fraunhofer devida a uma só fenda, dada pela 
(4.47) (com % = 0). 

A interpretação física da (4.59) é imediata: a contribuição da 2.º fenda só dife- 
re da 1.º pelo fator de fase exp(-ikad) , que resulta da defasagem associada à 
diferença de caminho entre as contribuições de pontos correspondentes das duas 
fendas. 

Reconhecemos na expressão entre colchetes da (4.59) o mesmo fator de inter- 
ferência já encontrado na discussão do experimento de Young: como vimos na 
(4.48), « = sen , onde O é o ângulo entre a direção de observação e a normal ao 
plano do anteparo. De fato, o arranjo experimental coincide com o do experimento 
de Young de duas fendas, observado na região de Fraunhofer. 

A distribuição de intensidade é então dada pela (3.22): 


2 


l (6) = 1 (@)- 420s? (5) l (4.60) 


onde 
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'A=kdoa=A=kdsenb6| (4.61) 


é a defasagem entre pontos correspondentes das duas fendas e A (0) a intensidade 
que teríamos se apenas uma fenda estivesse aberta, dada explicitamente pela (4.46). 


A função cos? (4/2) é uma função periódica da defasagem A , de período 
2x, cujos máximos correspondem às direções de interferência construtiva: 


An=2mn o ad=dsnd=-mA (m=0,+1,+2,.) (462) 


A função Jı (œ) é proporcional a sen X/X? , e seu pico central está com- 
preendido entre os pontos 


© ca-asng=*1/2 (4.63) 


Temos, necessariamente, d > 2a (por que?), e vamos supor que o espaçamento d 


entre as duas fendas é algumas vezes maior que a largura 2a de cada fenda. 


> sen 6 


Fig. 4.29 Figura de difração de um par de fendas 


Nesse caso, o fator h(0.) de difração por uma só fenda varia lentamente com q, 


em confronto com o fator de interferência 4cos? (4/2), e seu efeito é produzir 


i g 


uma modulação do fator de interferência , conforme ilustrado na fig. 4.29. Os má- 
ximos de interferência dados pela (4.62), que se chamam máximos principais, va- 


riam lentamente de intensidade devido ao produto por A ( œ). 


N fendas 

É fácil agora generalizar esses resultados ao caso em que temos N fendas idên- 
ticas, de largura 2a, com seus centros igualmente espaçados de uma distância d, 
dispositivo conhecido como rede de difração. 

O fator de defasagem entre as contribuições da 1.º fenda e as de pontos cor- 
respondentes da fenda de ordem p + 1 é agora aquele associado à distância pd 
entre seus centros, ou seja, expl-ika(pd)], de forma que obtemos, no lugar da 
(4.59), 


(4.64) 


se a)= f&a) h petted p gitad, y gena 


A expressão entre colchetes é a soma de uma progressão geométrica de razão 
expl-ikwd)e N termos, dada por 


(4.65) 


(4.66) 


Temos 


pesto -ee 
= 2ű - cos A) = ser(5) 


(4.67) 
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de forma que, finalmente, 


1@)= 3 (e) 


(4.68) 


Para N = 2, como ser (2x) = 4sen°xcos?x , a (4.68) se reduz à (4.60), con- 
forme deveria ser. 

Vejamos agora como se comporia o fator de interferência de N fendas 
sen (NA/2)/sen?(A/2) como função de Ae de N. 

Notemos primeiro que ele continua sendo uma função periódica de A, com 
período 2x, conforme seria de se esperar, pois efeitos de interferência não se al- 
teram se acrescentarmos à defasagem um múltiplo de 27. Logo, basta estudar a 
função dentro de um período, p.ex. em - T <A < 7 , è basta tomar A > O, pois 
é uma função par. à 

Para A = 0 a função vale Nº. Isso porque temos interferência construtiva en- 
tre as N fendas: a amplitude da resultante é N vezes a de uma só fenda, e a inten- 
sidade é amplificada por Nº. Por outro lado, para A = 1/2, o numerador e o 
denominador são da ordem da unidade, e a função é - N ? vezes menor do que 
para A = 0. Para N grande, caso que nos interessa, basta considerar portanto a 
região IA] << 1, onde sen?(4/2) = (A/2), e por conseguinte 


sem(NA/2) a sem (NA/2) 
sen*(A / 2) (nas 2; 


(In <<1) (4.69) 


cori(Nao) 


Nesta região, recaímos assim na fun- 
ção sen v/v? multiplicada por Nº? 
A fig. 4.30 mostra o gráfico da fun- 


N ção. Os pontos onde A, = mT, OU Se- 
ja w=ma/d (m=0 «-.). cha- 
| mam-se máximos principais: m é a or- 


a dem de interferência. A largura de um 
pico (máximo principal) é dada por 


ai honsronasenonfer= 


Fig. 4.30 A função (4.69) 


NA/2=&tn > A/2=t7/N (4.70) 


ou seja, é da ordem de À /(Nd), N vezes menor que o espaçamento entre os máxi- 


mos principais. Assim, à medida que N aumenta, os picos em torno dos máximos 
principais vão-se tornando cada vez mais estreitos. 


sen“(NA/2)/ser (4/2) 
Nº 


[| 
k 


|| 
| 


| 
| 
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Fig. 4:31 Figura de difração da rede 


A figura de difração da rede, como no caso de duas fendas, resulta da modulação 
da figura de interferência pelo fator lentamente variável Jı (œ) , figura de difração 
de uma fenda única. O aspecto da figura resultante está ilustrado na fig. 4.31. 


4.10 Dispersão e poder separador da rede 


Resulta da Seç. 4.9 que uma rede de difração com um número N muito grande 
de fendas produz uma figura de difração formada por uma série de raias brilhantes, 
nas direções dos máximos principais, 


| à | 
ä = sen 0a = M (n=0,41,..)| an) 
| 


Os máximos secundários, muito menos intensos, podem scr desprezados. 


A semilargura de cada raia é dada por [cf.(4.70)]: 


da = ô(senO)= cos0 30 = 


a 


Nd 


(4.72) 


onde 6 não se afasta muito da direção 6, = O de incidência, de forma que 
cos8 = cos@ = 1, ou seja, 


A 
50 = — 
Nd 
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Fig. 4.32 Superposição de dois comprimentos de onda 


(4.73) 


Até agora supusemos que a luz incidente é monocromática. Se iluminarmos a 
fenda-fonte (fenda do colimador que produz o feixe incidente) com luz não-mono- 
cromática, a (4.71) mostra que os máximos principais associados a valores diferen- 
tes de À caem em direções diferentes. A rede efetua portanto a decomposição es- 


pectral da luz incidente, produzindo uma série de espectros, um para cada ordem 


m, exceto para m = Q (direção de incidência), onde todas as imagens se superpõem. 
A fig. 4.32 mostra também que a separação entre À; e À2 aumenta com a ordem 
m do espectro. Para ordens muito elevadas, porém, começa a haver superposição 


de espectros (acima, m = 5 deh com m = 4 de à»). 


As principais qualidades de um instrumento para aplicação em espectroscopia 


são a sua dispersão e o seu poder separador. 
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A dispersão D é a taxa de variação d89/d À do desvio com o comprimento de 
onda À. Quando maior D, maior a separação angular associada a uma dada variação 
de À, o que facilita a medida. Pela (4,71), 


E 4 (4.74) 


para uma rede. 

Logo, D aumenta com m, como vimos na fig. 4.32, e varia inversamente com 
o espaçamento d entre as fendas: a difração abre tanto mais o feixe difratado quan- 
to menor for d. 

A qualidade mais importante para análise espectral é o poder separador, 
S=A/84A, já definido na discussão do interferômetro de Fabry-Perot [cf. (3.39)] 
Pelo critério de Rayleigh, duas linhas À e À + 8 estarão no limite do poder sepa- 
rador num especiro de ordem m dada quando estiveram separadas pela semilargura 
do máximo principal correspondente. 

Isso significa que o máximo principal de ordem m para À + SA, dado por 


seno = (+82) 


coincide com o 1.º zero depois do máximo principal de ordem m para À, dado por 


vu seja, identificando, 


O poder separador da rede é o produto da ordem do espectro pelo número 
total de fendas. A razão da proporcionalidade com N é que a largura de cada raia 
é inversamente proporcional a N. Note que S é independente de d, porque a di- 
minuição de d aumenta proporcionalmente a dispersão e a largura de cada raia. 


Pela (4.71), m = dsen6/A,, de forma que a (4.75) também se escreve 


Nd seng 
de | 


(4.76) 


ou seja, o poder separador é igual ao número de comprimentos de onda contidos 

em NdsenbB, que é a diferença de caminho, medida em unidades de à, entre os 

raios difratados pelas duas fendas extremas da rede (Nd é a largura total da rede). 
Em resumo: 


] S (=N), (EN?) = intensidade 
+ aumenta 4S (em), D (em) 
al D(=1/d) | 


N 
Aumentando m 
17 


Portanto, convém sempre tornar d tão pequeno e N tão grande quanto pos- 
sível; para uma dada largura Nd, aumentar N ao máximo. Também convém obser- 
var em ordem m tão alta quanto possível. O problema aqui vem da superposição de 
espectros para m elevado, mas ele se reduz quando se observa uma região muito 
pequena do espectro. As primeiras redes de difração foram construídas por Fraun- 
hofer em 1819, usando uma malha de fios de prata, com 10 fios/mm. Posterior- 
mente, ele construiu redes riscando uma série de linhas paralelas equidistantes nu- 
ma placa de vidro, com uma ponta de diamante (as fendas eram as partes não 
riscadas). 

A análise anterior requer essencialmente que a estrutura da rede seja perió- 
dica; não é preciso que (œ) corresponda à transmissão através de uma fenda: 
pode corresponder à reflexão regular. As redes mais usadas em espectroscopia são 
redes de reflexão, obtidas riscando uma placa retletora (os riscos difundem a luz 
em todas as direções, correspondendo aos intervalos opacos). 

Rowland, no final do século passado, construiu em Baltimore redes com ~ 5.500 
linhas/cm numa distância de - 15 em, totalizando ~ 80.000 linhas, e atingindo um 
poder separador - 160.000 cm 2.º ordem. O espaçamento d nesse caso já atinge 
ordens de grandeza comparáveis a À no visível! Como ele tem de ser extremamente 
uniforme, a construção envolve problemas técnicos dificílimos. Redes de difração 
comerciais são réplicas, usando redes padrão como moldes. 

Quando olhamos para uma luz distante com os olhos semicerrados, as pestanas 
atuam como uma rede de difração (irregular!) e vemos cores. 


122 Dilração 


Os sulcos de um disco LP ou CD, regularmente espaçados, funcionam como 
uma rede de difração, que permite ver, por reflexão, uma série de espectros. 

Nos anos 70, foi desenvolvida uma nova técnica de fabricação de redes cha- 
madas holográficas, que permite atingir milhares de linhas/mm em distâncias de 
até ~ 50cm , com poder separador superior a 10º (cf. Seg. 4.12). 


4.11 Difração de raios X 


As redes de difração consideradas acima são unidimensionais: a periodicidade 
dos elementos da rede (fendas) é em uma única direção. Uma rede bidimensional é 
uma estrutura duplamente periódica, isto é, com dois períodos em direções diferen- 
tes. Exemplos são duas redes unidimensionais cruzadas, ou uma cortina de gaze. 
Uma rede tridimensional (triplamente periódica) seria muito difícil de construir 


na região vi 


ível do espectro, devido à regularidade necessária, que já é difícil de 
atingir em uma dimensão, como vimos. Entretanto, a Natureza fornece estruturas 
triplamente periódicas regulares: os cristais. Para observar efeitos de difração com 


eles, porém, a radiação incidente precisa ter um comprimento de onda À com- 


parável ao espaçamento d entre os elementos da rede. 

No caso de um cristal, d é da ordem das distâncias interatômicas, ~ 10*em 
(= 1 À). Radiação eletromagnética com comprimento de onda dessa ordem está no 
domínio dos raios X. 

Os raios X foram descobertos em 1895, por Wilhelm Röntgen, quando fazia 
experiências com raios catódicos (feixes de elétrons acelerados); os raios X eram 
produzidos quando os elétrons colidiam com as paredes do tubo evacuado, e Rônt- 
gen mostrou que se propagavam em linha reta e tinham um grande poder de pene- 
tração. Por vários anos, procurou-se descobrir a natureza dos raios X. Eram partícu- 
las neutras, e foi sugerido que poderiam ser ondas eletromagnéticas (como a luz) 
de comprimento de onda da ordem de À. 

Em 1912, Max von Laue teve a idéia de testar essa hipótese procurando de- 
tetar a difração de raios X pela rede tridimensional dos cristais 

Um cristal ideal é formado por átomos distribuídos sobre uma rede periódica 
tridimensional. A rede pode ser gerada a partir de três vetores de base não-copla- 
nares a, b, e , que representam períodos de translação da rede. A escolha desses 
vetores não é unívoca. 

O vetor de posição de um ponto arbitrário da rede é da forma 


[m=narpb+ge, (4.77) 
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onde n, p e q são inteiros quaisquer (0,4 1,+2,...). A rede é constituída por 
todos os pontos de coordenadas (n, p, q) inteiras no referencial (a, b, e ). Abre- 
viaremos por l a terna (n, p, q). 


Consideremos um feixe colimado de raios 
X incidente sobre o cristal, representado 


pela onda plana 


nesa] (438) 


onde | é o versor da direção de incidên- 
Fig. 4.33  Espalhamento por um étomo cia. Ao incidir sobre um átomo na posi- 
mari entah ção Pı (fig. 4.33), produz-se uma onda es- 
palhada (difratada) que, num ponto de observação P a grande distância do cristal, 
é da forma 


n(P)= ba) A (6) e | (4.79) 


onder’ = IPPI, fé o versor da direção de observação OP (O é uma origem fixa 
no cristal), e f (à) é a amplitude de espalhamento (difração) na direção à devida 
ao átomo do cristal situado na posição P}. 

Como na (4.27), temos, para R >> dimensões do cristal, 


(4.80) 


de modo que a (4.79) fica 


O E a) spf- r @-i) x] | (4.81) 


R 


que deve ser comparada com a (4.35). 
Somando as contribuições de todos os átomos do cristal, obtemos a onda total 
em P: 


vB- Lnf)=4 10) pesi | (487) 


onde a ba t uma soma rripla sobre l = (n, p.q ).- 

Suponhamos, para simplificar, que o cristal tenha a forma de um paralele- 
pípedo [que pode ser oblíquo, como os eixos (a, b, e) | com NPQ átomos, e que a 
origem é tomada num vértice. A (4.82) se escreve então 


ER NEM Guia eos EM curas 
v(P)=A — f ODN 5 -i pk (ü-û, }b 
na p= 
1 
s gt (doe (4.83) 


1 


que é a generalização tridimensional da (4.64). 
Cada um dos somatórios é da forma da expressão entre colchetes na (4.64). de 
forma que a intensidade difratada na direção a pelo cristal todo é 


sr (ENA,) s? (tPA) sno) 


[010 ga) Ga) GA) 


(4.84) 


A å 3 Pae : 
onde h (u), a intensidade espalhada por um só átomo do cristal, chama-se o fator 
de forma atômico, e 


A =k@- ü) a ; A,=k(6-0)-Db ; A=k(a-4)-e (4.85) 


O resultado obtido é a generalização a três dimensões da (4.68), e o fator de 
interferência é o produto de 3 fatores análogos ao último fator da (4.68). 

Os máximos principais são definidos por três condições simultâneas de interferência 
construtiva: A a = Zma T ; Ap = 2m7 è Ac=2mT, onde Ma, Mb, € M. são in- 
teiros, o que equivale a 


(-d)a=maA; Goih mA 


| 
| 


p= Eba) E m S0 E) F m= 


As (4.86) chamam-se condições de Laue. 
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Num máximo principal, o fator de interferência reduz-se a (N PQ}, onde N, 
P e Q são da ordem do número de átomos por aresta do cristal, ou seja, são extre- 
mamente grandes. Podemos então desprezar os máximos secundários, obtidos quan- 
do ao menos uma das condições de Laue não é satisfeita: a figura de difração 
reduz-se às direções dos máximos principais 

Dada a direção de incidência do, à direção à do máximo principal de ordem 
(Ma, Mo , Me ) deve ser obtida como solução simultânea das (4.86). onde as incógni- 
tas são as componentes de L 

Entretanto, temos 3 equações para apenas 2 incógnitas, pois tem de ser satis- 
feita a condição 


É =1 (4.87) 


Tsso só acontece, em geral, para valores especiais de À. 

Para compreender melhor essa condição, consideremos um caso simples, em 
que os vetores de base a, b, c, formam um triedro triretângulo, e tomemos uma 
onda incidente na direção de e. Sejam (0:,B,Y) os cosenos diretores da direção à 
e a=lal,b=Ibl,c=lel As componentes de ue i são então: 


ü=(a,ß,y)} w=(0,0,1)c as condições de Laue ficam: 
| À A 
5 m, q B= mo, 
| (4.88) 
x 
(Y-1= m5 
| A 


Para ma , mp e m, dados, essas equações definem, cada uma, um conjunto de 
direções que formam um ângulo constante (de coseno dado por œ, B ou y) com um 
dos eixos, ou seja, um cone em torno do eixo correspondente. A direção de um 
máximo principal teria de ser uma geratriz comum aos três cones. 


Fig. 4.34 Interpretação geoméirica das condições de Laue 
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Na fig. 4.34, foram representados cones com eixo b associados a ms = 1.0 e 
—1 [para m, = 0, o cone degenera no plano (a, c)]. Uma chapa fotográfica O 1d 
é cortada pelos cones segundo hipérboles com eixo / a [para mp = 0, num seg- 
mento de reta]. 


As famílias de hipérboles associadas 
aos pares (m,m), representadas na 
fig. 4.35, têm pontos de intersecção e 
que satisfazem às duas primeiras con- 
dições de Laue e representariam a fi- 
gura de difração de uma rede bidi- 
mensional (aparecem, p. ex. 
se- olha através de uma cortina de gaze 
para uma fonte de luz distante). A in- 
tersecção com a chapa fotográfica O 
da terceira família de cones, de eixo c, 
é uma família de círculos, um dos 
quais (mc = 1) foi representado em linha interrompida na fig. 4.35. Vemos que, 
para um dado À, como nesse caso, não haverá em geral pontos de intersecção co- 
muns às três famílias de curvas: isto só ocorrerá para valores especiais de À. 


quando 


Fig. 4.35 Famílias de hipérboles 


Entretanto, se fizermos incidir sobre o cristal um espectro contínuo de raios X, 
como o que resulta do freamento de um feixe de elétrons acelerados, o cristal se- 
lecionará os valores discretos de À para os quais hé iniersecções comuns às 3 
famílias de curvas (satisfazendo às 3 condições de Laue), e aparecerão na chapa 
fotográfica as “manchas de Laue” associadas a estas direções. Também resulta da 
análise acima que a disposição dessas manchas, ou seja, da figura de difração, re- 


flete a simetria interna do cristal. 


Amostra Diagrama 
(cristal) de Laue 


E ad 
y ~= 


to 
Ta Colimador Í 
ubo de de Pb 
raios X Chapa 
fotográfica 


Fig. 4.36 Dispositivo para difração de raios X 


A experiência foi realizada pela primeira vez por Friedrich e Knipping, ainda 
em 1912, usando o dispositivo experimental ilustrado na fig. 4.36. O resultado con- 
firmou as previsões de Laue e o caráter de ondas eletromagnéticas dos raios X. 
Laue ganhou o Prêmio Nobel de 1914 pelo seu trabalho sobre difração dos raios X. 

O Prêmio Nobel do ano seguinte, 1915, foi concedido a William Henry Bragg 
e a seu filho William Lawrence Bragg pela introdução de uma nova técnica de 
observação da difração de raios X. Os Bragg empregaram radiação X monocro- 
mática, variando os ângulos de incidência (por rotação do cristal) até obter máxi- 
mos principais. 


Fig. 4.37 Reflexão espacial 


W. L. Bragg mostrou que as condições de Laue podem ser interpretadas como 
se se tratasse de uma reflexão espacial dos raios X, o que significa o seguinte: 
consideremos uma dada família de planos reticulares do cristal, ou seja, de planos 
paralelos e equidistantes que passam pelos átomos da rede. 

Imaginemos que haja “reflexão” de um raio por um desses planos. isto é, que. 
ao incidir sobre um átomo desse plano numa direção que forma um ângulo 6 com 
o plano, o raio seja “refletido” segundo o mesmo ângulo (0 é o complemento dos 
ângulos de incidência e reflexão). Para que haja interferência construtiva entre essa 
“reflexão” e a “reflexão” por um átomo correspondente do plano vizinho da 
família, à distância d (fig. 4.37), é preciso que a diferença de caminho 2 d sen6 
seja um múltiplo inteiro de À: 


2dsenb=mA (m=1,2,3,- (4.89) 


Se essa condição é satisfeita, resulta que há interferência construtiva entre as 
“reflexões” pelos étomos de todos os planos da família, ou seja, temos uma re- 
Jlexão espacial. Pode-se mostrar, o que não faremos aqui, que a condição de Bragg 
(4.89) é equivalente às condições de Laue, ou seja, define uma direção de máximo 
principal (a demonstração não é simples). 
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Num espectrômetro de Bragg para raios X, o cristal é montado sobre uma 
plataforma giratória que permite variar o ângulo de incidência 8. Outra maneira de 
apresentar simultaneamente ao feixe de raios X toda uma gama de ângulos O é o 
método dos pós microcristalinos de Debye e Scherrer, em que o cristal é pulveri- 
zado, de modo a constituir um agregado de microcristais cujas faces estão orienta- 
das ao acaso. Por simetria, a figura de difração correspondente é formada de anéis 
concêntricos. 


4.12 Holografia 


A figura de difração de raios X de um cristal contém informação sobre a estru- 
tura tridimensional do cristal: por exemplo. a simetria da figura está diretamente 
ligada à simetria do cristal. 

Em 1942, W. L. Bragg teve a idéia de procurar utilizar a imagem de difração 
de raios X de um cristal sobre uma chapa fotográfica como uma espécie de “rede 
de difração” ótica, iluminando essa imagem com luz visível e procurando, na luz 
difratada, ver até que ponto seria possível reconstruir através dela a estrutura do 
cristal. 

Entretanto, essa idéia enfrentava uma dificuldade séria, conhecida como o 
“problema da fase”, na difração de raios X e em outras situações análogas. A chapa 
fotográfica registra a intensidade das ondas luminosas que a atingem, mas não pre- 
serva nenhuma informação sobre a fase das ondas. Como uma parte da informa 


estrutural está contida na fase. o registro das intensidades difratadas, por si só. é 
insuficiente para a reconstrução do cristal. 

Em 1949. Dennis Gabor teve a idéia de um processo que permitiria registrar 
não só intensidades, mas também fases, convertendo informações de fase em infor- 


mações de intensidade, através de interferência. Usando, como Bragg havia suge- 
tido, um processo de duas etapas, Gabor propôs reconstruir mtegralmente. numa 2. 
etapa, as frentes de onda provenientes do objeto, registradas na 1.º. Essas frentes 
de onda, atingindo a vista de um observador, produziriam a mesma sensação visual 
que o próprio objeto. A idéia do processo, chamado de “holografia” (do grego, 
“registro completo”), valeu a Gabor o Prêmio Nobel de 1971. Foi somente na déca- 
da de 60 que a holografia ganhou maior impacto, graças a uma idéia de E. N. Leith 
e J. Upatnieks (descrita abaixo). que eliminou uma desvantagem séria da proposta 
inicial, e graças ao uso de lasers. 


Ao contrário da fotografia, que reproduz sobre uma chapa uma imagem bidi- 
mensional de um objeto, usando um sistema de lentes, a holografia, sem utilizar 
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lentes, permite reconstruir a luz proveniente do objeto mantendo suas característi- 
cas tridimensionais. A idéia inicial é a seguinte: 


Objeto SA X Vemos normalmente um objeto pela luz 
que ele espalha, proveniente de uma fon- 
te de luz que o ilumina. Sobre um plano 
E intermediário entre o objeto e a vista 
do observador (fig. 4.38), as frentes de 
onda associadas à luz espalhada pelo ob- 


a 
Fonte de luz A 


Fig. 4.38 Idéia básica da holo; 


jeto produzem uma certa distribuição da 
função de onda v(P’), em amplitude e fase. Decorre do Princípio de Huygens- 
Fresnel que, se conseguirmos registrar e reproduzir essa distribuição sobre E, as 
frentes de onda daí por diante sesão as mesmas viiginalimente provenientes do ob- 
jeto, produzindo portanto a mesma sensação visual para o observador. Daí a idéia 
de Gabor da holografia como um método de reconstrução das frentes de onda. 


A 1.º etapa, o registro, incluindo amplitude e fase, se obtém pela interferência 
entre a luz vinda do objeto e um feixe de referência. Para que a interferência seja 
eficaz, é essencial que a luz utilizada seja coerente, com clevado grau de coerência tanto 
espacial como temporal. Por isto, a holografia só tornou-se viável graças à invenção do 
laser. Na 2.º etapa, a reconstrução das frentes de onda originais a partir do registro 
(holograma), a idéia foi utilizar o mesmo feixe de referência para iluminá-lo. 

Vamos ilustrar o procedimento num exemplo extremamente simples, a repro- 
dução de um objeto puntiforme muito distante, ou seja, de uma onda plana mono- 
cromática proveniente de uma direção i, que faz um ângulo 9 com a normal ao 
plano E: 


x)= Ati (490) 


Onda de 
referência 


ROX 


X 


onde 


(ene,0,cos0) (4.91) 


| 
É 
É 
B 
l 


Ki 
É 


Vamos usar como feixe de referên- 
cia uma onda plana análoga, mas que se 
propaga na direção (—- 6): 


SEE 


RZS 


G) = aei (492) 


Fig. 4.39 Feixe de referência 
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onde 
à = (-sen6,0,cos6) (4.93) 


As duas ondas interferem sobre a chapa X, onde x =x" = (x',y',0), dando 
uma resultante 


vos) += (Gik = pet “) 


(4.94) 
=A p + gteat) =2Acos (ksen z”) 
A chapa fotográfica registra a intensidade I da resultante, dada por 
ce 
| 1(x)= lv (e) + va (x) f = 44° cos? (ksen0 x’) (4.95) 


Note-se que, graças à interferência, a fase (k sen® x’) da onda incidente vinda 
do objeto fica registrada numa distribuição de intensidade (enegrecimento) da cha- 
pa fotográfica. 


Logo, revelando a chapa, ela conterá (fig. 
4.40) uma distribuição de franjas de in- 
terferência (paralelas à direção y) perió- 
dica com o período 


0 E 2x d= =D 
ksanB Kseng k sen A 2 sen@ 


Fig. 4.40 Registro no holograma 


como uma rede de difração unidimensional, em que os picos de 1 correspondem às 
partes opacas, e o entorno dos zeros (não enegrecidos) às fendas. Note que a escala 
de distâncias d é da ordem de À (com luz visível, não se perceberia a olho nu; a 
chapa teria um aspecto uniforme). Vemos ao mesmo tempo que é possível construir 
uma “rede de difração holográfica” por esse processo. 

Se agora iluminarmos esse “holograma” (rede de difração) com o feixe de re- 
Jerência, ou seja, tomando a (4.92) como onda incidente, os máximos principais de 


difração serão dados pelas direções n’, tais que [cf.(4.86)] 


(-d)-d=mA (m=0.+1,..) 


onde d = (4.0.0) e dy = (-sen6.0,cos6). Logo, se 


= (sen6,0, cos 67 | 


isto dá 


A 


=mh 
2 sen8 


(sen €'+ sen 6)d = (sen 0’ + sen 0)- 


Para 6 e 6” e suficientemente pequenos, com sen6 = O, senO” = 6 
então: 


f 
| fm=-1 6 g =-36 
|2 +1i=2m jm=0 6 6'=-0 


| m=1 6 6-6 q válido mesmo sem 
y $ a aproximação ĝ << 1 
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Fig. 4.41 Reconstrução da onda objeto 


mostrando que, a partir do holograma, é reconstruída, em 1.º ordem (m = 
onda plana objeto (fig. 4.41), na direção 8. 


(4.98) 


= vem 


(4.99) 


D.a 


Pode-se mostrar (Probl. 4.14) que, para uma rede com o perfil sinusoidal de 
transmissão dado pela (4.95) e a onda incidente de referência, só existem as ordens 


132 Digo 


m==1,0. A ordem 0, como sempre, é associada à onda incidente. A ordem — 1 
chama-se onda conjugada e propaga-se numa direção que é a imagem especular da 
onda objeto reconstruída, em relação à direção m = O da onda de referência. 

No processo originalmente sugerido por Gabor, tomava-se 8 = 0, de forma 
que as três ondas viajavam na mesma direção, tomando difícil a separação da onda 
objeto. A idéia de usar O + O foi de Leith e Upatnieks, permitindo a separação 
espacial da onda objeto reconstruída e contribuindo muito para tornar a holografia 
viável na prática. 


Consideremos agora, de forma extremamente simplificada e esquemática, a ge- 
neralização do procedimento acima a uma onda objeto arbitrári: 
iluminação do objeto por luz coerente, como a de um laser. Seja vo (x) a função 
de onda objeto no ponto x” da placa fotográfica, 


a, proveniente da 


o (8) = fo æ] É O (4.100) 


onde po é a fase. 

Seja va(x a função de onda de referência no mesmo ponto, coerente com 
vo. Em geral, va se obtém, por subdivisão, do mesmo feixe de luz laser que ilumina 
o objeto: 


va E) = a (7) O (4.101) 


Analogamente à (4.95), a chapa fotográfica responde à intensidade resultante 
em x”, 


16)= fio) EF = 65 +) Co +) 


dbo bos Ee] (4.102) 


va [o + fvr e) Po (9) 


2 


X 


-i [po 0% EJ] 


+ [vo e) [ve 6) e 


+ [ve (x 


onde a informação de fase está contida nos termos de interferência. 

O fator (porcentagem) de transmissão da amplitude T da chapa fotográfica em 
cada ponto, uma vez revelada, depende da intensidade I(x”) naquele ponto (a 
transmissividade é | T? Je 
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Como o enegrecimento. que reduz T , cresce com 7, vamos admitir, para simplifi- 
car, que T é da forma 


T) 


TE) =T+KI(x) | (4.104) 


onde T é a amplitude de transmissão média do holograma (placa revelada) e 
K < 0 é uma constante. 

Se iluminarmos agora o holograma com a onda de referência, a amplitude 
complexa transmitida v (x), pela definição de T , é a onda incidente multiplicada 
por T . Ignorando o termo constante T, resulta então que v(x’) é dado por 


VR) = K (e) (e) = pe EO 


é, 


o (res EA y 


oo (6x eñ] 


vE) = Kal pof + af) e70 + 


t paf + pal bol Po 


ou seja, 


4K al ei Po (o) 


(x 


(4.105) 


vo x) 


aK Pa fo GO CO. 6 


O primeiro termo, que se propaga na direção da onda de referência, corresponde 
a m = 0 na (4.99). O segundo é a reconstrução da onda objeto (m = 1) no plano E 
e portanto, pelo Princípio de Huygens-Fresnel, daí por diante. O fator Ive ? não 
afeta a reconstrução, porque usualmente Ive? é praticamente constante sobre o 
holograma. Finalmente, o terceiro termo, que corresponde a m = — 1 na (4.99), se 
propaga em outra direção e não interfere no processo. É proporcional ao complexo 
conjugado da onda objeto (daí o nome de “onda conjugada”). Produz uma “ima- 
gem pseudoscópica” do objeto. 


PROBLEMAS 


1. Uma onda plana monocromática incide pcrpendicularmente sobre um an- 
teparo opaco com uma beirada retilínea, projetando a sua sombra sobre outro an- 
teparo, paralelo ao primeiro, e situado dentro da região de Fresnel. Demonstre que 
a intensidade difratada, num ponto situado exatamente no limite da sombra geomé- 
trica da beirada, é igual a fo/4, onde J é a intensidade incidente (não-obstruída). 


2. Uma abertura circular de diâmetro igual a 3,1 mm num anteparo opaco é 
iluminada perpendicularmente por uma onda plana monocromática. Num outro an- 
teparo paralelo ao primeiro, a uma distância de Im, o centro da figura de difração 
é escuro. Afastando-se gradualmente o anteparo de observação, o centro torna-se 
brilhante, depois escurece de novo e se ilumina mais uma vez, permanecendo bri- 
lhante daí em diante, por mais que se afaste o anteparo de observação. Qual o 
comprimento de onda da luz? 


3. A construção sobre um plano X 
das zonas de Fresnel pode ser 
estendida a uma onda incidente es- 
férica, proveniente de um ponto 
fonte F (fig.). Nesse caso, o pólo O 
se obtém unindo o ponto de obser- 


vação P à fonte puntiforme F e to- 


mando a intersecção com E, e as 


zonas de Fresnel são definidas pe- 
las condições (fig.): 


FR+BP=RAR tign 


Os raios das zonas são p; = OPi, pz = OP, 
define da mesma forma que para uma onda incidente plana. Demonstre que o raio 


Uma lente de Fresnel se 


da n-ésima zona de Fresnel é dado por 


onde 


fórmula análoga à de uma lente, em que R’ é a distância objcio e R a distância 
imagem. Verifique que, no caso limite de uma onda plana, o resultado se reduz ao 


4. Considere a função f(X) = sem X/X (figura de difra 
Mostre que os máximos secundários são raízes da equação tg X, = Xn e procure 


o de uma fenda). 


determinar seus valores, bem como os de f(X,). para n = 1, 2, 3, usando métodos 
gráficos ou numéricos (calculadora). 


5. Um feixe paralelo de laser de argônio (À = 4.880Ã), colimado por um 
diafragma de 1 mm de raio, é dirigido para a Lua. Calcule um limite inferior para 
o raio do feixe ao atingir a Lua e compare o resultado com o raio da Lua. 


6. (a) O telescópio refrator do observatório Yerkes tem uma objetiva com | m 
de raio. De que ordem de grandeza é a menor separação entre dois objetos na Lua 
que podem ser resolvidos com esse telescópio? (b) A objetiva do telescópio refletor 
do Monte Palomar tem 5m de diâmetro. Para observação com um filtro azul 
(À = 4.000 Å), qual é a menor separação angular entre duas estrelas que pode ser 
detetada? 


7. Interprete geometricamente, em termos da representação dos números com- 
plexos por vetores no plano complexo, a condição para que se tenha o primeiro 
zero, após um máximo principal, do fator de interferência 


F=lte 


8. Demonstre que, para qualquer rede de difração, na incidência perpendicu- 
lar, o vermelho do espectro de 2.º ordem se superpõe ao violeta do espectro de 3.º 
ordem. 
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9. Numa rede de difração. o espaçamento entre as fendas é igual ao dobro da 
largura de cada fenda. Mostre que todos os máximos principais de ordem par estão 
ausentes. 


10. Uma linha espectral de comprimento de onda À 750 À é na realidade 
um dubleto, de separação 0,043 À. (a) Qual é o menor número de linhas que uma 
rede de difração precisa ter para separar esse dubleto no espectro de 2.º ordem? (b) 
Se a rede tem 10 cm de comprimento, em que direção O será observada a linha 
nesse espectro? Qual será a separação angular ô O entre as duas componentes? 


11. Seja dq a diferença entre as frequências angulares de duas raias espec- 
trais que estão no limite do poder separador de uma iede de difração, e 64 a difer- 
ença entre os tempos de percurso de dois raios difratados pelas extremidades da 
rede na direção de observação dessas raias. Demonstre que d0 84 ~ 27. 


12. Por um defeito de fabricação, as fendas 1, 4, 7. ..(3 N + 1) de uma rede 
com (3 N + 1) fendas ficam tapadas. (a) Calcule o fator de interferência para a 
intensidade dessa rede defeituosa. (b) Mostre que, entre cada par de máximos prin- 
cipais da rede perfeita, aparecem dois novos máximos da rede defeituosa, igual- 
mente espaçados e de intensidade 4 vezes menor que os máximos principais. 


13. Uma pessoa olha através de uma cortina de gaze para uma lâmpada de 
sódio (À = 5.890Å ) situada a 10m de distância, e vê uma rede aproximadamente 
quadrada de pontos brilhantes. com espaçamentos de 5 cm em ambas as direções. 
Quantos fios por cm tem a trama da gaze? 


14 Conforme a Seç. 4.12, Fq. (4.95). a amplitude transmitida por um holo- 
grama de onda plana é proporcional a cos (k sen 9 x”). Mostre que, para uma rede 
de difração com esse perfil de “fendas”, só se formam os máximos principais 
m=0, +1, para a onda incidente de referência, conforme foi afirmado após a 
(4.99). 


POLARIZAÇÃO 


5.1 Equações de Maxwell num meio transparente 


Na expressão de Newton “um raio de luz tem lados 
distintas em diferentes direções transversais à direção de propagação. Para estudar 


ou seja, propriedades 


essas propriedades de polarização, não podemos mais tratar as ondas de luz como 
escalares: temos de reconhecer seu caráter rransversal, retomando a teoria eletro- 
magnética da luz (Fis.Bás. 3, Cap. 12). 

Vamos discutir a propagação de ondas eletromagnéticas em meios transparen- 
tes, que têm de ser isolantes, porque num condutor a energia eletromagnética é 
absorvida pelo efeito Joule (por isto os metais são opacos). A propagação é tratada 
na ausencia de fontes de luz: não há cargas nem correntes livres (nem correntes 
ôbmicas). 

Assim, o ponto de partida são as equações de Maxwell num meio dielétrico 
(Fís.Bás. 3. Cap. 12). com p= j=0. 


[o riB = p 
| p 
(1) mE = -2E 


(5.1) 


(mn) aivD=0 


(Iv) divB=0 


(5.2) 


é o vetor deslocamento ( P = densidade de polarização) e x é a constante dielétrica 
do meio (x = 1 no vácuo) 

Vimos (Fís.Bás. 3, Cap. 12), ao procurar soluções que só dependem de 
uma coordenada (tomada como z) e do tempo +. que. para um vetor 
v=w(z RA NARA tem-se 


rotv(z, t)= 


o que dá 


2 


rot roty = — 3 — para v = E. Vis 0) (5.3) 
E 
= 5 (0tB) = 
=p ÊD gen Eg O 
ho se dad E aa 


onde, agora, 
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A mesma equação é encontrada para Bs e B,. 
Sabemos, porém, que, num meio transparente de índice de refração n, a velo- 
cidade da luz é 
go E 
n 6.6) 


Comparando com a (5.5), obtemos a RELAÇÃO de MAXWELL 


6.7) 


ou seja, o índice de refração de um meio transparente é igual à raiz quadrada de 
sua constante dielétrica. Esse é um resultado típico da teoria eletromagnética da 
luz, relacionando uma constante ótica de um meio material (7) com uma constante 
eletromagnética (x). 

Entretanto, para testar o acordo com a experiência, é essencial lembrar que existe 
dispersão: o índice de refração de um meio varia com a frequência, e o mesmo 
acontece com K: a comparação tem de ser feita à mesma frequência O . 

Para muitas substâncias, n e K não variam apreciavelmente até que q) chegue 
à região do infravermelho distante (À ~ 300um), de modo que podemos testar a 
(5.7) tomando n nesta região e o valor estático de x: 


Substância moyn x (estático) 
Ka 48 4,15 
KBr 5,1 4.66 

NH4 CI 68 6.85 


Vemos que há razoavelmente bom acordo nesses casos. O mesmo vale para 
gases fracamente dispersivos, até no visível (luz amarela): 


Substância n? (amarelo) x (estático) 
Ar 1,000294 1,000295 
H2 1,000138 1.000132 


co 1,000346 1,000345 


Tá para substâncias mais fortemente dispersivas, as discrepâncias entre 7° (luz 
amarela) e K (estático) podem ser grandes. Para a água, n (luz amarela) = 1,33 e 
Ve (estático) = 9. Por outro lado, para comprimentos de onda À > Im, o índice 
de refração da água é = 9. 


5.2 Vetor de Poyniing real e complexo 


No interior de um dielétrico, como vimos (Fís.Bás. 3, Cap.5). a densidade de 
energia elétrica aumenta por um fator x, de forma que a densidade toial de energia 


eletromagnética é dada por 


Ho 


E E ES E N A Ew 
Dto DR Do 
o que dá, usando as equações de Maxwell (5.1), 
SU E D SD. B 9B E sa B OLE 
dt ne dt Mo dt mo Ho 
sav (Exe) 
=m 
ou seja, como no caso do vácuo (Fís. Bás. 3, Cap.11), 
| ðU 
dvS+— =0 5.9 
| EP (5.9) 
é a expressão local da conservação da energia, e 
[ 
| 1 
| S-—ExB VETOR de POYNTING (REAL) (5.10) 
| 


continua representando a densidade de corrente de energia. 
Ainda para uma solução das equações de Maxwell do tipo onda plana na di- 
reção z, 


E-E(e-vi)t, BeA Gry (5.11) 


com É = z — vt, as equações de Maxwell (I) e (II) dão 


u) 


ou seja, 


B=12xE p= ) (5.12) 


v [o 


que generaliza 0 resultado obtido para o vácuo. 


Ea 
Para uma onda plana que se propaga numa direção U qualquer, 


B=láxE=(£Eh àxE (5.13) 
E 


o que dá 


1 
ou E =U; 614) 
o 


ou seja, continua valendo que, numa onda eletromagnética plana, as densidades de 
energia elétrica e magnética são iguais. 
A (5.10) dá também, usando a (5.13), 


y 
E a 
K £ E` 


-m É 
NE £a Ho 


ikea ra 
s=L Ex(ûxE ~ E? ĝ = 
m = fg, 


ou, finalmente, 


(5.15) 


análogo de j = pv: S é a densidade de corrente de energia, e U é a densidade de 
energia, que se propaga com velocidade v = va. 


Ondas monocromáticas 


Em notação complexa, uma onda monocromática é da forma 


5 EE, )= Re | Eb) er 


e] 


(5.16) 


B(r.7)= Re [ B (r) 


ca 


e já vimos (Fís.Bás. 2, Cap.3) que podemos trabalhar diretamente com as grandezas 
complexas e tomar Re só no fim, enquanto usamos só operações lineares. Mas isso 


não vale para o produto de dois números complexos 4 e B, porque 


Re(4B) + ReA ReB (5.17) 


Por conseguinte, é preciso tomar cuidado ao calcular expressões quadráticas. 
a. ou produtos, como o vetor de Poynting. Na região 
e não podemos seguir a variação instantânea extre- 


como as densidades de ene 
do visível, porém, © ~ 10! 
mamente rápida destas grandezas: os detetores registram só seus valores médios 
temporais sobre um grande número de oscilações, que podem ser expressos de for- 
ma simples na notação complexa. 


s 


Para ver isto, calculemos 


(el ae Jef neem )) 


onde a e b são dois números complexos independentes do tempo. e 
p euT a 
)=— (dt , T=> 5.18 
UO== Í HO) (5.18) 
ta 


é a média temporal de f(t) sobre n períodos. Temos 


Re (a ee Re be )= 


(a dya er) 


w= 


a (eb tab ra sabe 
4 


Mas 


de forma, que finalmente, 


(re (ee io Pl (ttar )= > Reg) (5-19) 


Em particular, os valores médios temporais das densidades de energia elétrica 
e magnética associadas às (5.16) são 


| 1 
|W €.) =i Kejet 
| (5.20) 
| Ed 2 
(ro) = ET jB 
e, para o vetor de Poynting, obtemos 
j=-(4 \ SE 
(S) = (—E x B) = ReS (5.21) 
[io o | 
onde 
Is =- ExB 
| Zu | (5.22) 
chama-se o vetor de Poynting complexo. 
Para uma onda plana na direção i a (5.13) dá 
£o a 
Ba E x (ü xE )= + û 
Eng o 
ou ainda [cf.(5.15) e (5.20)] 
=s"=»(Ujã-v.owa Ef à (5.23) 
| 


A intensidade I da onda eletromagnética é 
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1 = (S): â = (U) = Ex eo vE} | (524) 


ou seja, é proporcional a | EI” ; vemos que E representa a “função de onda” veto- 
rial associada à luz. 


5.3 Ondas planas monocromáticas. Polarização 
A onda plana mais geral possível que se propaga na direção z é da forma 


le, =f(g- vi) 
(5.25) 
E =g(2-vt) 


onde fe g são funções arbitrárias. O campo B correspondente é dado pela (5.12): 


Ls a 
B=5ôx (E+E, 


*(1,8+2,9) 


ou seja: 


zdi o 
B zee a) 
| (5.26) 
=le- 
B, = FQ vt) 


Para uma onda plana monocromática de frequência angular ©, a dependência 
do tempo (em notação complexa) deve ser da forma exp(-i 01) ; logo, como 


g= tis- y= a dependência de z é da forma exp(ikz), onde 


n— =k ky = número de onda reduzido (no vácuo) (3.27) 
ë 


Logo, a onda plana monocromática mais geral possível que se propaga na di- 
an k Ag 
reção u = Z é dada por 


| E, = ae® d6 ya 


(5.28) 


-dte sp, 
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onde a eb(>0) são as amplitudes reais das duas componentes transversais e 
(&. 8) as respectivas constantes de fase. Sem restrição de generalidade (por esco- 
lha adequada da origem de f ou de z), podemos tomar 3. = O . Passando para a 
notação real. teremos então 


E, =acosd 
b= (5.29) 
= bcos(® + ô) 
onde 
5=8,- (5.30) 


é a diferença de fase entre as duas componentes. 

Consideremos um plano fixo. p. ex., z = 0. Nesse plano, o vetor E varia com 
o tempo (O = — qt), e sua extremidade descreve uma curva. Que curva é? Suas 
equações paramétricas (5.29) mostram que [El <a, IE < b, de modo que a 
curva está inscrita num retângulo de lados 24 e 2b. É a “curva de Lissajous” asso- 
ciada à composição de duas oscilações em direções perpendiculares com defasagem 
6, já estudada no curso anterior (Fís. Bás. 2, Seç. 3.5). 

Para obter a equação da curva, basta eliminar O entre as (5.29): 


E, 
FA = cos(D + 8) = cos © cos ô — sen O sen 


E) (6) (jose mf] 


E) fé | 
(Eoss +=) = sor” 8 | (531) 
j\a a 


curva do 2.º grau que, por estar inscrita num retângulo, só pode ser uma elipse 
(podendo degenerar num círculo ou segmento de reta). 

Logo, a curva descrita pela extremidade de E num plano fixo é uma elipse. 
Decorre das (5.28) que B também descreve uma elipse, mantendo-se sempre L E. 
A onda plana monocromática mais geral possível é elipticamenie polarizada. 

A forma da elipse depende da defasagem à . Vejamos primeiro casos particu- 
lares, 


(i) Luz linearmente polarizada 
Corresponde a 


snr (n (5.32) 


o que dá, na (5.31). 


ou seja, 


; ($ E 
n impar 4 
b a 
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As duas situações estão representadas 


na fig. 5.1. Como E permanece sem- 


pre numa mesma direção (idem para 


B), diz-se que a onda é linearmente 


ô=(ensr polarizada. Convenciona-se chamar o 
r plano (E, d de plano de vibração, e o 
Fig. 5.1 Polarização linear r 
plano perpendicular (B, ð, de plano 
de polarização. Em particular, se b = 0 ou a = 0, temos as duas direções de polari- 


zação ortogonais (independentes) x e y. 


(Gi) Luz circularmente polarizada 


Para que a (5.31) se reduza à equação de um círculo, duas condições devem 


ser satisfeitas: 


(5.34) 
As (5.29) reduzem-se então às equações paramétricas de um circulo: 
acos®, E, = acos (e +na+ a) = (1) asend (5.35) 
ou ainda, como & = — of, 
|e = acos (0t), E, = (f ason (o 9 (5.36) 


A diferença entre n par e n ímpar está no sentido de percurso do círculo (fig. 
5.2). A extremidade de E também pode ser representada no plano complexo por 
E + iE 


n par [E +iE, =a! n impar JE, +iE, = ae"! | 
| em 


(anti-horário) (horário) 
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Esquerda 
(n par) 


Direita 
(n ímpar) 


Fig. 5.2 Polarização circular 


Voltando à notação complexa, as (5.35) se escrevem: 


E 


de modo que 


E =E, +E, ĵ= ad’ REiĵ) 


Sejam 
RE Gif) : é-19) 
E =- GE+iy = 
pat 
Então. 
| Gj n os q E ni 
| E, =0e €, = luz circularmente polarizada esquerda 
| | 
| [E_ = ae? Ê_ = luz circularmente polarizada direita | 
l — E | 
Como 


a (5.38) pode ser reescrita: 


(5.38) 


(5.39) 


(5.40) 


(5.41) 
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E (5.42) 


mostrando que uma onda plana monocromática arbitrária pode ser representada 
como superposição de uma onda circularmente polarizada direita com uma onda 
circularmente polarizada esquerda 


Gii) Luz elipticamente polarizada 


Voltando agora ao caso geral, vemos pela (5.31) que os eixos da elipse só 


coincidem com os eixos x e y quando 8 = nm + em outras situações, estão 


2 
inclinados. Por argumentos de continuidade e analogia com polarização lincar 
e circular, obtemos as seguintes representações gráficas (fig. 5.3) com a va- 


riação de ô: 


mm 


Fig. 5.3 Polarização eliptica 


5.4 Atividade ótica natural 

Existem substâncias transparentes que têm índices de refração diferentes para 
luz circularmente polarizada esquerda e direita. Isso se deve em geral a uma estru- 
tura assimétrica das moléculas, que têm “helicidade”, ou seja, um sentido privile- 
giado de rotação cm torno de um cixo, como um parafuso de rosca dircita (ou 
esquerda). Um exemplo é uma solução de açúcar de cana (mais geralmente, de 
origem orgânica). 


Ex 


j 
| Vejamos o que acontece quando uma 
| 


op=—— 


| 


onda plana monocromática linearmente 
— »z polarizada incide sobre um tal meio (fig. 


[= 


5.4) e atravessa uma espessura d dele. 
Omitindo o fator e 
é da forma 


-ior 


. a onda incidente 


Fig. 5.4 Alravessamento de meio oiicamente ativo 
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(so) | (5.43) 


e tomamos a origem na face de entrada, onde 


E = E 8 


(5.44) 


(desprezaremos a reflexão). 
Pela (5.42), podemos decompor essa onda em uma onda circularmente polari- 
zada esquerda e outra direita: 


E(:=0)= Eg a i & (5.45) 
2 
Os fatores de propagação das duas ondas dentro do meio são diferentes: 
| E P E KR 
| E G@)= 2 E + eE (es 0) (5.46) 
| v2 v2 
onde 
[k nk nk | (5.47) 


en(n) é o índice de refração para polarização circular esquerda (dircita). Seja 


(5.48) 


o índice de refração médio, e 


| (5.49) 


Seo mamii (5.50) 
2 


e a (5.46) se escreve 


ou seja, 


Finalmente, após atravessar uma espessura d, 


[o a (3 ( 
DOT cos [Bag a | sen [SE $ (5.51) 


que, pela (5.33), é uma onda lincarmente 
polarizada numa direção (fig. 5.5) for- 
mando um ângulo 8 com Ox, onde 


Fig 55 Rotação dn plano de polarização (5.52) 


p TE A 
quando a polarização inicial (5.44) era x. 
Logo, uma substância oticamente ativa produz uma rotação do plano de po- 


larização de luz linearmente polarizada incidente sobre ela, e o ângulo de rot 


o 
é proporcional à espessura do meio atravessada e à diferença 8n entre os índices 
men . Se n, > n- , a rotação é para a direita (sentido horário), e a substância se 


diz dexirógira; sen. < n- , é levógira. 


e 


O açúcar de cana ou beterraba é dextrógiro, e é este açúcar natural que 


metabolizado pelos seres vivos; o açúcar levógiro (produzido em laboratório) não é 
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metabolizado. Não se sabe se a origem dessa assimetria biológica é um acidente 
ligado com alguma assimetria do ambiente em que a vida se originou. Todos os 
aminoácidos são levógiros. 

Aplicação à indústria do açúcar: n; e n são proporcionais à concentração da 
solução, de forma que a medida de Q é utilizada em sacarímetros para determinar 
e 


concentração. 


5.5 Condições de contorno 


Para tratar o problema da reflexão e refração, precisamos saber o que acontece 
com o campo eletromagnético na interface entre dois meios de propriedades mate- 
riais diferentes. Embora idealizemos essa interface como uma superfície de descon- 
timundade, o que ocorre de fato é que a transíçao de um meio ao outro se dä através 
de uma região que cobre várias camadas atômicas: a espessura h desta região é 
porém muito pequena em confronto com os comprimentos de onda típicos no visível. 

Assim, embora os operadores div e rot não possam ser aplicados a uma função 
descontínua (derivadas parciais na direção normal à camada divergem), podemos 
ver o que acontece com as equações de Maxwell aplicando-as, em sua forma inte- 
gral, à camada de transição, e passando ao limite h > 0. A discussão abaixo é 
análoga à que se encontra em Fís.Bás. 3, Seç. 5.7. 


Seja P um ponto interno à camada € v um 

vetor que pode representar um qualquer 

Meio 2 hs dos campos eletromagnéticos. Aplique- 
| mos o teorema da divergência a um volu- 

me cilíndrico (fig. 5.6) centrado em P, 
com bases de área AS nos dois meios e 


altura h , onde faremos h —> 0. de modo 
que o fluxo através da superfície lateral 
do cilindro será desprezível em confronto 


A 
com o fluxo através das bases. Se m2 é O 


versor da normal a AS orientado do 
Fig. 5.6 Cálculo da divergência superficial meio 1 para o meio 2 (fig. 5.6), obtemos 


em 


dy-has =AS v -Âp — AS WD fav vav 
5 d 


= diy vAV = div vASh 


lim (h divy) (5.53) 


onde Div y é chamado de divergência su- 
perficial do vetor v. Vemos que mede a 
descontinuidade na componente normal 
de v (diferença entre as componentes de 
v normais à interface nos dois meios). 
Analogamente, seja I um circuito orien- 
tado retangular, de altura A e base Al (h 
infinitésimo de ordem superior a A/), cen- 
trado em P e apoiado entre os dois meios 
(fig. 5.7), e apliquemos o teorema de 
Meio 1 Stokes à circulação de v ao longo de T, 
desprezando a contribuição dos lados de 
altura h: 


Fig. 5.7 Cálculo do roiacional superficial 


fyar=w dai-wial= [revNdz=rtv-Ralh (5,54) 


f az 


onde fé o versor da tangente a F no meio 2 e Ñ é o versor da normal à área AL 
interna à T. Vemos pela fig. 5.7 que 


t=Nxã, (5.55) 


de modo que a (5.54) fica 
lim (a roty) Ñ = (vi): Q x âa)= [ox "DN (556 


Como a orientação de Å num plano paralelo à interface é arbitrária, concluímos que* 


“lim (h roty) = ñy x (v, — v;))= Rot v (5.57) 


j A 
= 0, poderia haver, em princípio, uma componeme de A rot v // Ra . Entretanto, isso 
não acontece, porque uma tal componente, tomando z // Me, seria 


afã E! 


x) 


que — O com 4, porque as derivadas de v em direções tangenciais à interface permanecem finitas. 


* Sendo sempre Å - M 
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onde Rot v é o rotacional superficial de v, e mede a descontinuidade na compo- 


nente tangencial de v. 

Se multiplicarmos, nas equações de Maxwell (5.1), os dois membros das (II) e 
(IV) por k, fazendo h — De notando que derivadas em relação ao tempo, como 
9 B/ ðt, permanecem finitas, obtemos 


Ko à, X(E -E)=0| 
| (5.58) 


(V) à (-B)=0 


que são condições de contorno gerais para o campo eletromagnético [porque as 
eqs. (TI) e (IV) valem sempre]: 

A componente tangencial de E e a componente normal de B são sempre con- 
tínuas na interface entre dois meios diferentes. 

As (De (NT) das (5.1), válidas para meios transparentes, com p = j = 0, mos- 
wam que, nesie caso, a componente rangencial de B também permanece contínua, 


[© max(B-8)=0 | (5.584) 


de forma que Bz = Bı, e a componente normal de D = x £ E também é contínua. 


5.6 Reflexão e refração. Fórmulas de Fresnel 


Consideremos uma onda plana monocro- 


iot 


mática (omitimos o fator e ) inciden- 
te sobre a interface plana entre dois meios 
transparentes de índices de refração nı e 
n (fig. 5.8): 

Os versores das direções de propaga- 
ção das ondas incidente, refletida e refra- 
tada são respectivamente (fig. 5.8): 


à, = sen 8, È -— cos0, ĵ 


| 
a i al 
dj =senB, È +cos9, Ê | (5.59) 


X i ad 
; S = à, = sen 8, $- cosO, f | 
Fig. 5.8 Reflexão e refração a j 
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onde (x, y) é o plano de incidência e y = O a interface. Os fatores de propagação 


são, respectivamente, 


exp(1ọ;,) = exp (im ko û, +x) + explig)-explimkçã - x) 
(5.60) 
cxp (iq) = exp m ko À - x) 
o que dá. pelas (5.59), 
exp hig) = expļin ko (x sen8, -y ee) 
exp (gt) = expl im ka (e sen @, + y cos a )] (5.61) 


7 
= exp [im ko a sen, — y cose, )] 


exp (i 


Os campos podem sempre ser representados como superposições de duas po- 
larizações lineares perpendiculares. É conveniente escolher uma delas como per- 
pendicular ao plano de incidência, ou seja, / Oz no sistema de eixos escolhido, 
e a outra paralela ao plano de incidência. Vamos representar as amplitudes de 
componentes | por 4 e as // por B. 

Com o auxílio da fig. 5.8, obtêm-se as direções das componentes // de E. Os 
campos totais E; e E» nos dois meios são então: 


z B,e'* (cos, +$ sen6,) 


= (4 + Ae 
+ Bj d% (2 cus 6, + 3 seno) (5.62) 


E = A4, d™ 2+ B, é” (£cos0, +$sen6,) 


Os campos magnéticos correspondentes resultam da (5.13) 


1 


B, {a xtA dari xA d% (o dh B e)a} 


5 
i (5.63) 


| B, ad (âz xZA, aa: T 2) 
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E] Eua 
onde as componentes L estão na direção z (fig. 5.8). 
Ea A à dm? 
As condições de contorno (5.58), onde m2 = —y, dão (lembrando que 


Bı = Bo na interface, neste caso) 


7x Elo a À Elo 
(5.64) 
9xB, “a yx Bolos 
Pelas (5.61) e pelas leis da reflexão e da refração, temos 
[ 
| = (5.65) 


de forma que esse fator comum pode ser cancelado. De fato, a dedução das leis 
pela teoria ondulatória, vista na Seç. 2.2, equivale a dizer que a componente tan- 
gencial do vetor de onda k se conserva, o que leva às (5.65). 

As (5.62) e (5.64) dão então: 


(5.66) 
Pelas (5.59), 
ù, x Ż = — cos @, Å — sen 6, ĵ 
û; x ĉ = + cos 0,  — sen 0, + (5.67) 
q, x È = — cos 9, f — sen O, Î 
de forma que as (5.63) e (5.64) dão 
| Tg rs)=IB, 
4 Va 
(5.68) 


| 

| 

ita E 1 

| — (A, — Aj) cos8, = — A, cos8, 
» v 
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Vemos que as (5.66) e (5.68) se separam em dois grupos independentes, um 
contendo só as amplitudes A e outro só para as amplitudes B. É por essa razão que 
o uso de polarizações lineares / e L ao plano de incidência é o mais conveniente. 

Dadas as amplitudes 4; e Bı do campo elétrico da onda incidente, interessa- 
nos obter: 


B; 
R=32 , R= a amplitudes de reflexão 


| (5.69) 


amplitudes de transmissão | 


o que pode ser feito, porque temos, para cada par destas grandezas, um sistema de 
duas equações a duas incógnitas. Lembrando que [cf.(2.7)] v/v = m =n (vamos 


omitir o índice 12), as (5.66) e (5.68) dão: 


A +A 
| (5.65) 
ac apo at 
. cos8, 
e 
B+B=nB, 
5.66, 
P: cos 8, é ) 
B, -B =n 
cosĝ®, 


As amplitudes de reflexão e de transmissão obtêm-se facilmente resolvendo essas 


equações. Combinando os resultados com a lei de Snell, obtém-se (Probl. 5.10) 


-mẹ 6.) a 
15 enf +0) en, 
e 
ge 
g = ter 8) (5.68) 


“ts, +0) 


que são as fórmulas de Fresnel para as amplitudes de reflexão. Obtêm-se resultados 
análogos para as amplitudes de transmissão. 


Os resultados se simplificam para incidência L (04 = ® = 0). Resulta 
O es 
Ra SR g 25l (5.69) 
aaa O GS, 4 


que na verdade é o mesmo resultado nos dois casos. Com efeito, para 6, = 0, o 
plano de incidência não é definido; a diferença de sinal na (5.69) resulta só de ter 
adotado convenções de orientação opostas para E e E': neste caso (fig. 5.8). 
Como Ri >0 paran > |, isto implica que as direções de E c E, são opostas 
neste caso [defasagem de n, vi. (3.28)]. 


5.7 Refletividade 


Por definição, a refletividade é a fração da intensidade incidente sobre uma 
determinada área da interface que se reflete (porcentagem de reflexão). Lembrando 
a expressão da intensidade (5.24) e que as ondas incidente e refletida se propagam 
no mesmo meio é são simétricas em relação à normal, resulta que a reflctividade r 
é dada por (em notação complexa) 


(5.70) 


Em particular, para uma onda incidente linearmente polarizada com polari- 
zação L ou polarização //, respectivamente, as fórmulas de Fresnel dão 


| mB Fei] 
pet t-a . = Qro) 67) 
i sen? (@, + 93) tg? @, +83) | 
e, para incidência 1 [cf.(5.69)] 
| E | 
ses emo) om 
d 


Vamos discutir o andamento de rı e zı em função do ângulo de incidência 
9, supondo n > 1 (meio 2 mais refringente que 1). 
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Conforme já foi antecipado na Seç. 2.4, a refletividade é em geral muito 


pequena na incidência L. A (5.72) mostra que é = (1/7 f ~ 2% para uma inter- 


face ar/água (n = 4/3), e é = (1/5) - 4% para uma interface ar/vidro 
(r = 3/2). 

Por outro lado, para incidência rasante (9, —> 7/2), as (5.71) mostram que 
rı er, tendem a 1, ou seja, a luz tende a ser totalmente refletida (superfície de 
um lago atuando como espelho em relação a uma margem distante). 


Que acontece entre esses dois limites? Pode-se mostrar (Probl. 5.15) que 


(5.73 


de modo que r, cresce monotonicamente entre seus valores extremos. Para valores 
de n usuais (não >> 1) é preciso aproximar-se bastante da incidência rasante para 
que a reflexão seja apreciável. 


Já n, tem um andamento diferente. 


1.0 


Com efeito, a (5.71) mostra que existe um 
ângulo de incidência 6 = Oy para o qual 
nı = 0. É aquele para o qual o denomina- 
dor —> e, ou seja, 6, + 6) = 7/2, o que 
dá, usando a lei de Snell (cf. Probl. 2.1), 


tg0=n (5.74) 


E, 


Para O < 6 < 8p, nı decresce monotoni- 
camente; para 8, > 8, , cresce monotoni- 


e Bue ae zoe camente para 1 (fig. 5.9). 


— 
Fig. 5.9 Refleiividades para uma interface arividro 


Que acontece se a luz incidente é linearmente polarizada numa direção interme- 
diária entre L e //? 


` 


Plano de N, 
J rádni 


Jio 1 


Fig. 5.10 Azimute de incidência 


Seja E; o campo elétrico da onda incidente e œ seu azimute, definido como o 
ângulo que faz com sua projeção En sobre o plano de incidência. As componentes 


Le // de E são dadas por (fis. 5.10) 


| IE =[Elcosc ; [En] = Elsene 


Logo, as componentes L e / da onda refletida são 


Era 


= Ri) [Eu = [Rd [E] cosa: 


Ei 


= |R;| [6,4] = Ru] E sen œ 


e, como 1E% P =1E^uf + 1E’! a (5.70) dá 


o 
p = apC re T ae 


5.8 Polarização por reflexão 


(5.75) 


(5.76) 


Para 0, = 0, temos nı = 0. Logo, se, a onda incidente tiver polarização li- 
near //, não há onda refletida : toda a luz é transmitida. Se a onda incidente é 


linearmente polarizada com azimute'o. qualquer, somente a componente E, é 
refletida nesse ângulo. Logo, nesse caso, a luz refletida é linearmente polarizada, 


com E, perpendicular ao plano de incidência. 


Mais 
uma onda incidente monocromática, pois também podemos decompô-la em compo- 


almente, isso acontece qualquer que seja a polarização (elíptica) de 


nentes / e L . E acontece também para luz natural, emitida por um corpo incan- 
descente, como a luz solar, p. ex. - 

Com efeito, cada componente monocromática do espectro da luz solar pode 
ser decomposta em componentes / e 1 . Assim, se luz solar incide sobre uma pla- 
ca de vidro segundo um ângulo 0, = z = 57º, a luz refletida é linearmente polari- 
zada, com Ey L ao plano de incidência. 


Foi assim que Malus descobriu a polarização por reflexão: estava observando, 


em Paris, a luz do sol poente refletida pelas janelas do palácio do Luxemburgo, 
através de um cristal sensível à polarização. 


Para 6, = 8x, por definição, 
94 + @ = 7/2. Isso equivale a dizer que 
o ângulo de polarização 0» é aquele ân- 
gulo de incidência para o qual, segundo 
as leis da reflexão e da refração, o raio 
refletido é perpendicular ao raio refraia- 
do (fig. 5.11). Este resultado, descoberto 


por David Brewster em 1815, chama-se 
Fig. 5.11 A lei de Brewster lei de Brewster. 


Para luz natural, o vetor E; da onda incidente, em cada instante 1, pode ser 
decomposto em Ei e Ei 1, associados ao azimute instantâneo a (zt). Entretanto, ot 
variará rapidamente e ao acaso com o tempo: todos os valores de œ serão igual- 
mente prováveis, o que implica 


(cos? æ) = (sen? a) 6.77) 


IA 


onde (:--) é a média temporal. A (5.76) dá então a refletividade para luz natural 


pe à Gn) (5.78) 
A curva correspondente está representada em linha interrompida na fig. 5.9. 
Embora a luz incidente natural seja não- polarizada [cf.(5.77)]. isto não é ver- 

dade para a luz refletida. Com efeito, na luz refletida, teremos 
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(5.79) 


onde usamos as (5.71). 
A razão (5.79) só é = 1 para incidência L (0 = 0) ou razante (8) = 7/2). 


Dela é <1,ou seja, a luz 
refletida é parcialmente polarizada. com predomínio da componente L . O grau de 


Entre esses dois extremos. como se vê pela fig 


polarização é definido por 


(5.80) 


com 0 < P < 1 Para6=0 ou O; = T/ 2 , tem-se P = 0 : a luz refletida con- 
tinua sendo luz natural. Para 8, = 0, , éru =0 e P = 1: a luz refletida é total- 
mente polarizada. 


“= Polarizador | 


Luz natural 


L 4º plano de incidência. 


Fig. 512 Polarização por reflexão 


Isso pode ser verificado experimentalmente fazendo com que a luz refletida 
por uma placa do material (p. ex., vidro) segundo o ângulo 8; incida sobre uma 
placa do mesmo material, situada de tal forma que a componente E, em relação à 
1º placa (polarizador) passe a ser a componente E, em relação a 2.º (analisador). 
Para isso, basta que o 2.º plano de incidência seja L ao 1.º (fig. 5.12). Se, além disso, 
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orientarmos a placa analisadora de tal forma que o ângulo de incidência sobre ela 
(fig. 5.12). 
Suponhamos agora que, sempre mantendo fixo o ângulo de incidência 8s sobre 


também seja 6p. não há luz refletida pela 2* pla 


o analisador. façamos que ele gire (a normal Ñ ao plano do analisador na fig. 5.12 
permanece sobre o cone de eixo sobre o raio e abertura 65). O ângulo B entre os 
dois planos de incidência deixa de ser 7/2. Esse é também o ângulo entre as 
normais ao dois planos. Como E da onda incidente sobre o analisador é L ao 1.º 
plano de incidência (fixo), B é também o ângulo entre E e a normal ao 2.º plano de 


incidência, o que implica (veja a fi 


B=5" e (5.81) 


refletividade 
na 2º reflexão 
h 


Essa relação mostra como varia a intensidade da luz refletida pelo analisador com 
o ângulo À. Ela é = 0 na situação anterior [diz-se neste caso que o polarizador e o 
analisador estão com seus eixos cruzados (B = 7/2)]. e é máxima para B=0, 
quando os dois planos de incidência são paralelos, de modo que o vetor E incidente 
é L a ambos. Note que À é o ângulo entre a direção de vibração da luz incidente 
sobre o analisador (direção de E) e a direção para a qual a intensidade é máxima 
B=0. 

A (5.82) é um caso particular da LEI de MALUS: a intensidade analisada 


ão de vi- 


bração da luz incidente sobre o analisador e a direção para a qual a intensidade 


varia proporcionalmente ao quadrado do coseno do ângulo entre a dir 


da luz analisada é máxima. 

O aparelho constituído pelo par de placas de vidro chama-se polariscópio de 
Nórrenberg. O polarizador transforma luz natural em luz linearmente polarizada; o 
analisador permite detetar (analisar) a existência de polarização, fazendo variar À. 


Polarizador e analisador funcionam como filtros de polar ão. 


Uma placa de vidro não é um polarizador muito eficiente. O gráfico da fi 


mostra que 11 = 0,15 para 6; = 82. Aplicando a (5.78). concluímos que apenas 7,5% 
da intensidade incidente sobre o polarizador são aproveitados. 

Outros métodos de polarizar e analisar a luz empregam a transmissão através 
de meios anisotrópicos, como os cristais, cujas propriedades variam com a direção 
relativamente a seus eixos de simetria. Em seu “Tratado sobre a Luz” (1690), Huy- 
gens já discutia as propriedades óticas da calcita (conhecida naquela época como 
espato da Islândia). que pode ser empregada para produzir e analisar luz polarizada 
(prismas de Nicol). 


Edwin H. Land criou um material artificial, o Polaroid, capaz de absorver 
fortemente uma polarização linear preferencial, ao mesmo tempo que transmite a 
polarização ortogonal a essa. Um material que absorve diferentemente duas polari- 


zações lineares ortogonais chama-se dicróico. O polaróide é um plástico consti- 


tuído de moléculas de um polímero orgânico sintétic: 


o álcool polivinílico; são 
moléculas muito longas. Lâminas desse material são estiradas numa direção, pro- 
duzindo o alinhamento preferencial das moléculas: o dicroismo é reforçado pela 
adição de iodo. Como a luz solar refletida é parcialmente polarizada [cf. (5.80)], os 
óculos de Polaroid funcionam como óculos de sol e atenuam a luz refletida. 


5.9 Reflexão Total 


Até aqui, só discutimos o comportamento da refletividade para índice de re- 
fração relativo n > 1, quando o meio 2 é mais refringente que 1. 


Fig. 5.13  Reversibilidade dos raios 


Para ver o que acontece quando n < 1, notemos primeiro que, pelas leis da 
reflexão e da refração, se invertermos o percurso do raio refratado [fig. 5.13(b)]. 
inverte-se também o percurso do raio incidente, que passa a ser o raio transmitido 


5.0 Reflexão rota 165 


Por outro lado, as expressões (5.71) da refletividade não se alteram se trocar- 
mos os papéis de 0, e 02: 6 «> 6», 0 que troca n «> 1/n [isto também não altera 
a (5.72)], ou seja, a interface reflete igualmente bem de ambos os lados. 

Essa lei de reciprocidade permite obter o andamento de n; e rı em função do 
ângulo de incidência O, para uma interface com n < 1 (p. ex., vidro/ar, n = 2/3) 
a partir dos valores correspondentes para a transição inversa (ar/vidro, n = 3/2), 
trocando a escala de abscissas O, — 0. 


O resultado, para uma interface vidro/ar 
| mae J (n = 2/3), está representado na fig. 
|! | 5.14. As curvas do gráfico da fig. 5.9 a- 
parecem “comprimidas” entre 8, = 0 e 


8 = Ba, onde O, é o ângulo crítico de- 
finido na (2.13). 


I 
| sen®, 


n (5.83) 
Fig. 5.14 Refletividades para uma interface vidro/ar 


que, para uma interface vidro/ar, é = 41º. Para 6, — O. tanto zı como n; tendem 
a 1 (reflexão total). 

Que acontece para 6, > ©? Como indicado na fig. 5.14 e visto na Seç. 2.4, 
ocorre a reflexão total, ou seja, r1 E nı permanecem iguais a 1. Entretanto, isso 
não significa que o campo eletromagnético no meio 2 seja idênticamente nulo, pois 
ele é * 0 no meio 1 e isto violaria as condições de contorno. 

A lei de Snell daria 


senB, = d sen6, >1 para 9, > 9, (5.84) 
n 


o que não pode ser satisfeito por um valor real de 6», mas pode ser satisfeito por 
um valor complexo, que é permitido porque estamos usando notação complexa. 
As funções cosz e seng para z =x + iy complexo são definidas pelas fór- 


mulas de Euler, 


(5.85) 


cosz 


qo 1 
e E 2) š SEn mes 
“ai 


o que dá 


sen E = 1%) = cos(P) = > (+= nr (5.86) 


que é a função coseno hiperbólico, > 1 para Y > 0. 
Logo, podemos continuar satisfazendo a lei de Snell para 8: > 8, tomando 


i 
[o =Ž-iY o, snb -ap= Eis) >e) (587) 
| 3 


Embora até aqui tenhamos interpretado 8, geometricamente, como um ângulo, 
a verificação das equações de Maxwell e das condições de contorno só depende das 
propriedades analíticas de cosz e senz, que permanecem as mesmas para z com- 
plexo. 

Assim, as fórmulas de Fresnel (5.67) e (5.68) permanecem válidas, o que dá 


l Zary) | 
y safo, - E vv) cos(6 +17) a 
Ee = = é 

ã sen(9, + Eco) cos (8, — i¥) | 
+ (5.88) 

f 

z | 

pan tagar) cos (o ti a | 

1= $= A] 

s[e +Z- 0) cotg (8, — iY) | 

| 


onde usamos o fato de que o numerador e denominador são complexos conjugados, 
de forma que o quociente é um fator de fase (8, e 8 são reais). Logo, 


|. 426, (5.89) 


confirmando a ocorrência de reflexão total acima da incidência crítica. 
Além disso, vemos pelas (5.88) que as componentes | e // da luz refletida 
sofrem defasagens diferentes, criando uma diferença de fase 


3=5,-8, (5.90) 
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entre as duas componentes: & varia com 81. Podemos usar esse resultado para pro- 
duzir luz elipticamente polarizada a partir de luz incidente linearmente polarizada, 
através de uma única reflexão total. 


5.10 Penetração da luz no meio menos denso 


Vejamos agora como interpretar o valor complexo (5.87) de 6» para o campo 
eletromagnético que penetra no meio oticamente menos denso (n2 < 7). 

O fator de propagação dos campos no meio 2, e'2, é dado pela (5.61), onde 
temos de substituir 6> pela (5.87). que também dá sen 6». 

Por outro lado, 


cosB, = cos E -i| (5.90) 


de modo que obtemos 


exp (0.) = exp [in ko (ch y — i y sh F)] 
(5.91) 


= exp(in, ch Phaea 


o que representa uma onda que se pro- 
paga na direção x e se atenua exponen- 
cialmente na direção y < 0, isto é, à me- 
dida que penetra no meio 2: temos de to- 
mar ¥ > 0 na (5.87). Como o meio 2 é 
transparente, essa atenuação não está as- 


sociada à absorção de energia. Uma onda 


desse tipo (fig. 5.15) chama-se onda eva- 
Fig. 5.15 Onda evanescente nescente. 


Se tomarmos, p. ex.. a componente L na(5.62). supondo A; real, e voltarmos 
à notação real, o campo elétrico no meio 2 fica (reintroduzindo a dependência tem- 
poral) 


= A, cos (k's — mt) e“ G<0) (5.92) 


mk 7 


m ksh Y (5.93) 


O campo magnético correspondente é dado pela (5.62). onde & x Ê resulta da 
(5.67): 


Bj = -2l gg 6, È + sen 0, Ẹ | ele) 
vg | EST 
2 RY RF 


ou, voltando à notação real, 


sh Y sen (k'x — ot) e" 


(5.94) 


As (5.92)-(5.94) mostram a estrutura da onda no meio 2. 


Definimos a profundidade de penetração como a profundidade Iyl = d para a 


qual as amplitudes de E, e B> se reduzem a e ”' = 1/e do seu valor na interface. 


Portanto, 


Ia e 1 E a E (595) 
| K mkh” 2rmshYj 
: i 


No ângulo crítico 6, = B. , temos 'P = O e a profundidade de penetração é infi- 
nita, mas 'F aumenta rapidamente para 0, > @e [cf.(5.87)], c d cai logo a uma 
fração de comprimento de onda. 

À primeira vista, parece haver uma contradição com a conservação da energia: 
como pode haver penetração da onda no meio 2 se a reflexão é total? Para ver o 
que acontece com a energia, calculemos a densidade de corrente de energia no 
meio 2, dada pelo vetor de Poynting (real) associado às (5.92) (5.94): 


= Uy ch¥ e™ cos? (k'x — or)à 
(5.96) 


+ EL sh Y e?" sen (k'x — wr) cos (kx — mr) | 
o dz | 


Vemos que, em cada instante, há uma corrente de energia positiva na direção 
A Por aa 
X. ao passo que a componente y oscila entre valores positivos e negativos (com 
valor médio = 0) ao longo da interface. 


Fig. 5.16 Linhas de corrente da energia na reflexão total 


Uma porção das “linhas de força” de Sz (linhas de corrente da energia) num dado 
instante 7 na vizinhança da interface está representada na fig. 5.16. O conjunto se 
desloca para a direita com a variação de é. Se tomarmos uma média temporal ou 


espacial (sobre um intervalo de vários comprimentos de onda), obtemos das (5.96) 


(5.97) 


1 
© 


É fácil verificar que o vetor de Poynting complexo leva ao mesmo resultado. 

Vemos assim que, na direção y, a energia penetra e sai do meio 2, sem que, 
em média. haja transporte de energia para dentro do meio: a corrente de energia faz 
meandros em torno da interface. 


Isso ainda não explica como a energia pôde inicialmente penetrar no meio 2. 
Não dá para ver isso numa solução estacionária, como a que estamos consideran- 
do: a dependência temporal foi suposta monocromática de frequência © para 
= < 1 <oee: seria preciso considerar um problema não-estacionário, correspon- 
dendo a uma superposição de frequências. 

Outra idealização foi termos considerado uma onda plana incidente, que tem 
extensão infinita. No caso mais realista de um feixe de luz limitado lateralmente. 
tem-se uma superposição de ondas planas cujas direções de propagação variam, de 
modo que para uma parte delas a incidência está abaixo do ângulo crítico. Verifica- 
se nesse caso que a energia penetra e sai do meio 2 pelas fronteiras do feixe. 


Que acontece se tivermos uma lâmina de 
faces paralelas de espessura h, com 
m <m, e um ângulo 6 > 8- no 1.º 
meio? A onda evanescente no meio 2 terá 
então ainda uma amplitude finita ao atin- 
gir a outra interface. e dará origem a uma 
onda transmitida E; que se propaga na di- 
reção 0) (fig. 5.17). 

Logo, a reflexão deixa de ser total: o fe- 
nômeno chama-se reflexão total frustra- 
da. Entretanto, para que Es tenha ampli- 
tude perceptível, é preciso que a espes- 


Fig. 5.17 Refiexão total frustrada 


sura h não seja >> que a profundidade de 
penetração d; caso contrário, a atenuação exponencial da onda evanescente toma 
| E; | tão pequeno que não se consegue detetar a onda transmitida através da camada 


se Por isso, o efeito é muito difícil de obser- 
y ay var na região do visível, uma vez que h 
Ed não pode ser >> que o comprimento de 
onda (d é - À). Mas ele pode ser facil- 


mente detetado com ondas de rádio. Num 


experimento feito por J. Bose, dois pris- 
mas de asfalto (fig. 5.18) estavam separa- 
Y dos por uma distância A de vários cm e 
uma onda incidente de À = 20cm sofria 
reflexão total frustrada no 1.º prisma. Si- 
nais mais fracos puderam ser detetados atrás do 2.º prisma, com intensidade cres- 


Fig. 5.18 Experimento de J. Bose 
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cente à medida que A diminuia. Conforme veremos ao tratar de física quântica, esse 
efeito é o análogo eletromagnético do efeito quântico conhecido como tunelamento 
Surpreendentemente, porém, o efeito já havia sido detetado por Newton em 


seu segundo artigo publicado, data de 1675! Na experiência dos anéis de New- 


ton (fig. 2.10), na lâmina de ar que separa a lente plano-convexa da placa de vidro, 
pode não haver exatamente um contato com a placa, deixando uma camada de ar 
muito fina entre os dois. Newton percebeu que luz que deveria ser totalmente re- 
fletida conseguia atravessar essa camada desde que fosse suficientemente fina, e 


estimou a espessura em no máximo alguns comprimentos de onda: ele já havia 
usado suas medidas dos raios dos anéis para determinar com grande precisão o 
comprimento de onda. Foi Newton, portanto, quem descobriu a reflexão total frus- 


trada. 


PROBLEMAS 


1. Mostre que as equações de Maxwell (5.1), (5.2) num meio dielétrico não se 
alteram pela substituição: 


g-le, 
7 


desde que a constante a seja escolhida apropriadamente. Que acontece com o vetor 
de Poynting S nessa substituição? E com as densidades de energia Ur, Um? 


2. Demonstre, a partir das eqs. de Maxwell incluindo uma corrente j, a ex- 
pressão do balanço de energia médio para um campo monocromático, 


| -div s* = E+2i0 (U;) - (Ux) 
| 


onde 8” é o vetor de Poynting complexo. Interprete a parte real e a parte imaginária. 


3. Demonstre que os vetores de polarização circular (5.39) formam uma base 
ortonormal para um produto escalar de vetores complexos a e b definido como 
a - b, ou seja. que 


ê. ê -e,ê&-o, Ê 


4. Demonstre, para o caso geral de po- 
larização elíptica (5.29), que o ângulo 
Y entre o eixo maior da elipse de polari- 
zação e o eixo Ox é dado por (fig.) 


tga) cos 
EA 


5. Duas ondas circularmente polarizadas de mesma fregiência propagam-se 
na mesma direção, com amplitudes a c 2a, respectivamente. Descreva a polarização 
e orientação da onda resultante: (a) Se ambas são levógiras; (b) Se a é levógira e 
2a é dextrógira. 


6. Num meio anisotrópico, para luz que se propaga ao longo de uma “direção 
principal”, há dois índices de refração diferentes, nı e m, conforme a direção de 


vibração do campo elétrico esteja numa das duas outras “direções principais” per- 
pendiculares entre si e à direção de propagação. Chama-se placa de um quarto de 
onda uma lâmina do material cuja espessura d introduz uma diferença de caminho 
E) (ha = comprimento de onda reduzido) entre essas duas componentes do campo 
elétrico. (a) Calcule d; (b) Se uma onda linearmente polarizada segundo a bissetriz 
dessas duas direções principais incide perpendicularmente sobre uma lâmina de um 
quarto de onda, qual é a polarização da luz transmitida? (c) Calcule d para uma 


lâmina de mica, em que m, = 1,5941 e m = 1,5997, se ào = 6.000Ã. 


7. Faz-se girar um analisador de polarização em torno da direção da luz inci- 
dente como eixo, observando-se a intensidade da luz transmitida. (a) Mostre que 
isso não permite distinguir entre luz incidente circularmente polarizada e luz natu- 
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ral. (b) Coloca-se agora no trajeto da luz incidente, antes de atingir o analisador, 
uma lâmina de um quarto de onda (veja o Probl. 6). Mostre que isso torna possível 
fazer a distinção entre polarização circular e luz natural, e explique como. 


8. Chama-se eixo de um filtro de polarização (polarizador ou analisador) a 
direção de vibração para a qual sua transmissão é máxima. Um par de filtros têm 
seus eixos cruzados (perpendiculares), de modo que bloqueia a luz incidente. Colo- 
ca-se agora um terceiro filtro entre os dois, com seu eixo formando um ângulo 
8 com o eixo do 1.º filtro. Se luz natural de intensidade Jo incide sobre esse siste- 
ma, qual é a intensidade da luz transmitida? 


9. Use o operador Div para obter a condição de contorno na interface entre 
dois meios quando existe sobre ela uma distribuição de carga com densidade super- 
ficial ©. Aplique o resultado a um condutor perfeito. 


10. Calcule R, e Ri , definidos pelas (5.69), inclusive no caso particular 
8 = 0. Calcule Ti e Ti. 


11. A transmissividade t é definida co- 
mo a fração da intensidade incidente so- 
bre uma dada área da superfície de sepa- 
ração (indicada por AB na fig. ao lado) 
que é transmitida para o meio 2. 


(a) Mostre que 


(b) Calcule ñi, t (inclusive para 0, = 6, = 0). 


12. Verifique quer, + u=n+á=1 


13. Para 6, = 6 (ângulo de Brewster), (a) Calcule zı ; (b) Calcule ti ; (c) 
Calcule o grau de polarização da luz transmitida, 


14. Para que se tenha um filme anii-rejtetor (Seç. 3.3), de índice de refração 
situado entre dois meios de índices n; e m, não basta que a espessura do filme 
seja de 1/4 do comprimento de onda no meio 2 [cf. (3.30)]. É preciso também que 


a refletividade das interfaces 1/2 e 2/3, na incidência perpendicular, seja a mesma. 
Mostre que a condição para isso 


a 
é: m = Nan. 


15. Demonstre a (5.73). 


INTRODUÇÃO 
À RELATIVIDADE 


6.1 O Princípio da Relatividade ma Eletrodinâmice 


Vimos que, como consequência das equações de Maxwell, as ondas eletro- 
magnéticas se propagam, no vácuo, com velocidade c = 1/N £o io. que é uma cons- 
tante universal. Entretanto, ainda não discutimos uma questão básica: a que refe- 


rencial se refere essa velocidade? 

A dependência das leis físicas com respeito ao referencial foi discutida na 
Mecânica Clássica (Fís.Bás. 1, Seç. 13.1), onde vimos que as leis básicas da Mecâ- 
nica assumem sua forma mais simples nos referenciais inerciais. Por definição, um 
referencial é inercial se nele vale a lei da inércia, ou seja. uma partícula não sujeita 
a forças (sufi 


ientemente afastada das demais) permanece em repouso ou em mo- 
vimento retilíneo uniforme. Com boa aproximação. um referencial vinculado às es- 


trelas fixas é inercial. 

Vimos também que qualquer referencial em 
movimento retilíneo uniforme em relação 
a um referencial inercial é também iner- 
cial. 

Se o referencial ( S”) (fig. 6.1) se move 
em relação a ( $ ) com velocidade cons- 
tante V e as origens O e O” dos dois refe- 
renciais coincidem no instante f = 1" =0, 
vimos que a relação enire as coordenadas 


Fig. 64 Referênciais (S) e (S) 
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Lx(x,y.2),1]e [x'Cx” 
mação de Galileu 


*,2").1"] nos dois referenciais é dada pela transfor- 


(6.1) 


o de velocidades 


[v=v-vl (6.2) 


onde v e v’ são velocidades relativas a ( S$ ) e ( S”), respectivamente. Decorre 
também a igualdade das aceleraçõe: 


dv 
dr 


(6.3) 


“df 


Como a transformação de Galileu não afeta as distâncias entre partículas nem a 
massa, também não afeta uma força F que só dependa dessas distâncias (como a 
gravitação), de modo que 


F-ma > Fena (m =m) 6.4) 


isto é, a lei básica da dinâmica não se altera. 

Daí decorre o princípio de relatividade da Mecânica, devido a Galileu: é im- 
possível detetar um movimento retilíneo uniforme de um referencial em relação a 
outro por qualquer efeito sobre as leis da dinâmica (Galileu deu o exemplo de 
experiências de mecânica feitas sob o convés de um navio, com as escotilhas fecha- 
das, que seriam incapazes de distinguir se o navio estaria ancorado ou em movi- 
mento retilíneo uniforme). 

Vimos também na Mecânica que esse princípio deixa de valer para refer- 
enciais não inerciais: aparecem efeitos detetáveis sobre as leis da mecânica, através 
das forças de inércia (força centrífuga, força de Coriolis, etc.). 


Entretanto, se procurarmos estender à Eletrodinâmica o princípio de relativi- 
dade, deparamo-nos imediatamente com um problema: decorre das leis da Eletrodi- 
nâmica (eqs. de Maxwell) que a luz se propaga. no vácuo. com velocidade c. Ad- 
mitindo que isso vale num dado referencial inercial, e que valem as leis da Mecã- 


o 
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nica Clássica, o resultado não poderia valer num outro referencial inercial em mo- 
vimento retilíneo uniforme em relação ao primeiro com velocidade V. Com efeito. 
pela lei da Galileu de composição de velocidades. seria 


C=e-V (6.5) 


e, por conseguinte, seria c'+ c (e c” variaria com a direção de propagação), con- 
tradizendo o princípio de relatividade no caso da Eletrodinâmica. 

A validade das eqs. de Maxwell estaria restrita então a um referencial inercial 
privilegiado, onde a velocidade da luz é c em todas as direções. Isso acontece, p. 
ex., na acústica: as ondas de som se propagam através de um meio material, que é 
o suporte das oscilações 
direções) somente num referencial em que este meio está em repouso. Observada de 
outro referencial em movimento em relação a este, a velocidade do som é diferente 
e varia com a direção (Efeito Doppler: Fís. Bás. 2. Seç. 6.9). 


e a velocidade do som é isotrópica (a mesma em todas as 


A identificação do “vácuo” com um tal suporte material das ondas eletromag- 
néticas corresponde ao conceito do érer, meio hipotético cuja existência já havia 
sido postulada por Descartes. Vimos (Fís. Bás. 3, Cap. 11) que o próprio Maxwell 
chegou a suas equações com base num modelo mecânico para o campo eletromag- 
nético, um “éter celular”. 


Se o éter existisse como referencial privilegiado, deveria ser possível, por ex- 
periências de propagação da luz, detetar um movimento retilíneo uniforme em re- 
lação a ele, ou seja, o princípio de relatividade não seria válido na eletrodinâmica 
(da mesma forma que não é válido na propagação do som). 

Se quiséssemos. porém, manter o princípio de relatividade também na eletrodi- 
nâmica, a (6.5) mostra que isto não seria compatível com a validade simultânea das 
equações de Maxwell e das leis da mecânica newtoniana: uma das duas teria de ser 
abandonada. 

Teria de ser válida, portanto, uma das seguintes opções: 


(i) A mecânica newtoniana e as equações de Maxwell são válidas, mas o prin- 
cípio de relatividade não se aplica a todas as leis físicas: existe um referencial 
absoluto (o éter), onde a velocidade da luz é c em todas as direções, e deve ser 
possível, por meio de experiências eletromagnéticas, detetar um movimento reti- 
líneo e uniforme em relação ao referencial absoluto do éter. 

(ii) O princípio de relatividade aplica-se a todas a leis físicas e a mecânica 
newtoniana é correta. Nesse caso, as equações de Maxwell teriam de ser modifi- 
cadas, e deveria ser possível observar desvios das leis eletrodinâmica clássica. 


(iii) O princípio de relatividade aplica-se a todas as leis físicas, e as equações 
de Maxwell são corretas. Nesse caso. a mecânica newtoniana e a transformação de 
Galileu não podem ser corretas: deve ser possível observar desvios das leis da me- 


cânica newtoniana. 
A única opção compatível com os fatos experimentais, conforme vamos ver. é a (iii). 


6.2 O experimento de Michelson e Morley 


Consideraremos primeiro o teste experimental da opção (i). Se ela fosse váli- 
da, deveria ser possível detetar um movimento retilíneo uniforme em relação ao 
éter usando a lei de Galileu de composição de velocidades (6.5): a velocidade da 
luz num referencial em movimento relativo ao éter deveria ser diferente em di- 
reções diferentes. 

Um referencial onde o Sol estaria em repouso é com boa aproximação um 
referencial inercial, A velocidade de translação da Terra em relação a esse referen- 
cial é da ordem de 30 km/s, e sabemos que tem sentidos opostos em intervalos de 
meio ano, o que corresponde a uma variação de velocidade da ordem de 60 km/s. 

Logo, mesmo que um referencial ligado à Terra (laboratório) esteja em re- 
pouso no éter num dado instante. terá uma velocidade relativa a ele de ~ 60 km/s 
meio ano mais tarde. Durante metade do ano, a Terra tem uma velocidade V de 
pelo menos 30 km/s em relação a qualquer referencial inercial fixo. Pela lei de 
composição de velocidades, isso daria origem a desvios da ordem de V/c > 10º 
na velocidade de propagação da luz. 

Numa série de experiências realizadas entre 1881 e 1887, A. A. Michelson e 


E. W. Morley procuraram detetar esses desvios (muito pequenos) usando o inter- 


ferômetro de Michelson (Sec. 3.5). 

E, pe O interferômetro está representado es- 
quematicamente na fig. 6.2 (não foi re- 
“4” presentada a placa de compensação do 
6 caminho ótico). Seus braços têm com- 
| primentos he. F é a fonte de luz, P 
| t l a placa semiespelhada divisora do fei- 
poel a Ç% xe. Ee E são os espelhos e L é a 

E me — Ų luneta de observação. 
M hr — A experiência foi repetida muitas 
P $ F " vezes, com diferentes orientações da 


montagem como um todo. Suponha- 


Fig. 6.2 Experimento de Michelson e Morley mos que, na situação da figura, a 
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Terra esteja se movendo em relação ao (hipotético) éter com velocidade V na di- 


reção OE. 


Como e // V ao longo de J, temos [cf.(6.5) e fig. 6.3] 


(at) 


(b1) 


Fig. 6.3 Percursos longitudinais. A velocidade é ¢ = c — V na ida (a1) e e! =c + V ne volta (a2) 


= Tempo total para ida e volta ao longo de h 


(6.6) 


[B=v/c | (parâmetro adimensional) (6.7) 
| A: 


onde 
E 
O 
= fi 
A 
A 
J i 
Â 
/| ei 
Y jo et e 
/ | | 
| Y 
v 
(a2) (b2) 


Fig. 6.4 Percursos transversais 


Visto do referencial do éter, o percurso 
na direção de h é oblíquo, porque, duran- 
te o tempo de ida e volta da luz do espe- 
lho E, a placa P se terá deslocado de O; 
para Oz. Conforme mostram as figs. 6.4 
(a2) e (b2), tanto na ida como na volta a 
velocidade da luz no referencial da Terra 
será 


= ejl- f? (6.8) 


=v -y 


de modo que o tempo do percurso de ida 
e volta ao longo de h será 
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ga TE (6.9) 


A diferença de caminho ótico entre os dois percursos é 


aset- ão [do e) (6.10) 
EY 


Se os espelhos E; e E> não são exatamente perpendiculares entre si, essa diferença 
de caminho dá origem a franjas de interferência de igual inclinação na cunha de ar 
de pequena abertura formada por E» e pela imagem de F, na placa P (cf fig 318) 

Se girarmos agora de 90º o dispositivo todo, os papéis de | e b são intercam- 
biados, o que dá: 


(6.11) 


'=elt— 


A figura de interferência observada anteriormente sofrerá um deslocamento corres- 
pondente ao caminho ótico 


(6.12) 


(6.13) 


O deslocamento (6.12), medido cm termos de número de franjas, é então 
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| 
Sm= 


(6.14) 


ou seja, o efeito é de 2° ordem em V/c = . É por ser tão pequeno que se neces- 
sita de uma técnica interferométrica. 

Na 1.º experiência de Michelson e Morley (1881), era 4 = h = 1,2m e 
A =6 X 107m (luz amarela). Tomando B ~ 10*, como vimos no início desta Seção, 
resulta então |8m| ~ 0,4 x 10" x 10? ~ 0,04 de franja, o que teria sido detetado 
por um observador perito como Michelson (fim da Seç. 3.5). O resultado, para 
grande surpresa dele. foi, em suas palavras: “.. Não há deslocamento das franjas de 


interferência. Assim, demonstramos que a hipótese de um éter estacionário é incor- 


reta. 

Na repetição da experiência em 1887, era h = h = Ilm, o que daria 
Iml ~ 0,4 franja, e Michelson e Morley deram como resultado (limite superior) 
lmi < 0,01 (não observaram nenhum deslocamento). G. Joos, em 1930, usou 
h= h = 21m, dando um |m! esperado de ~ 0,75 franja, e achou como limite 
superior 187 | < 0,02 . Experimentos recentes de outros tipos (não baseados no 
interferômetro de Michelson) dão limites superiores para V inferiores a 30 m/s, 
compatíveis com V = 0, embora a velocidade orbital típica da Terra seja 30 km/s. 
Com isso, a opção (i) do final da Seç. 6.1 fica descartada (houve algumas tentati- 
vas de mantê-la com hipóteses diferentes, que também foram descartadas). 

As tentativas mais consistentes dentro da opção (ii), aceitando o caráter geral 
do princípio de relatividade c a validade da mecânica newtoniana e modificando as 
equações de Maxwell, foram baseadas na “teoria da emissão” de W. Ritz (1908). 

Segundo Ritz, c deveria ser interpretado como a velocidade da luz no vácuo 
relutiva à fonte emissora, e não como velocidade de propagação de ondas num 
meio. Como c seria então sempre uma velocidade relativa, o resultado nulo do 
experimento de Michelson e Morley estaria explicado (a transformação de Galileu 
não altera velocidades relativas), mas as equações de Maxwell teriam de ser modi- 
ficadas. 

As modificações da eletrodinâmica preditas pela teoria de Ritz foram des- 
cartadas com basc em observações astronômicas que seriam incompatíveis com 
elas, mas os argumentos empregados não são atualmente considerados como sa- 
tisfatórios 

Entretanto, a hipótese de Ritz foi eliminada por medidas diretas da velocidade 
da luz (na desintegração ° — Y+ y) emitida por uma fonte em movimento rå- 
pido, realizadas no CERN em 1964 por T. Alvager et al. O resultado experimental 


vidade 


foi que, se representássemos uma eventual dependência da velocidade v da fonte 
resultaria que k = (0 + 1,3) x 10%. 


porc'=c+ 

Podemos tirar dos resultados acima descritos as seguintes conclusões: 

(A) PRINCÍPIO DE RELATIVIDADE RESTRITA: As leis físicas são as mes- 
mas em todos os referenciais inerciais. 

Por outro lado, as equações de Maxwell são confirmadas como leis físicas 
válidas, e daí decorre o 

(B) PRINCÍPIO DE CONSTÂNCIA DA VELOCIDADE DA LUZ: A velocidade 
da luz no vácuo, c, é a mesma em todas as direções e em todos os referenciais 


inerciais, e é independente do movimento da fonte. 


Esses dois princípios, porém, são incompatíveis com a mecânica newtoniana, 


tornando necessário modificá-la. As modificações necessárias. tomando (A) e (B) 
como pontos de partida, foram propostas por Albert Einstein em 1905, em seu tra- 
balho “Sobre a Eletrodinâmica dos Corpos em Movimento”. 


Einstein era um jovem empregado no Escritório de Patentes em Berna, recém- 


formado pela Universidade, quando publicou esse trabalho. No mesmo ano, publi- 


cou dois outros trabalhos fundamentais: um deles sobre o efeito fotoelétrico (Seç. 
7.3), reintroduzindo a teoria corpuscular da luz no contexto da teoria dos quanta de 
Planck, e o outro sobre o movimento Browniano. Ao que tudo indica, Einstein não 
conhecia os resultados do experimento de Michelson e Morley quando formulou a 
relatividade restrita; eles não são mencionados no seu artigo. 

Na introdução a seu trabalho de 1905 sobre relatividade, Einstein comenta de 
início a descrição aparentemente assimétrica dos efeitos de indução eletromagnética 


entre um ímã e um fio condutor, conforme seja o ímã ou o fio que se move, quan- 


do só importa o movimento relativo (Fís. Bás. 3, Seç. 9.1). Depois diz: 

“Exemplos desse tipo. bem como as tentativas malogradas de detetar um 
movimento da Terra em relação a um “éter”. sugerem que os fenômenos ele- 
trodinâmicos, da mesma forma que os mecânicos, não têm quaisquer proprie- 


dades compatíveis com a idéia de repouso absoluto. Sugerem, pelo contrário, 


que as mesmas leis da eletrodinâmica e da ótica serão válidas em todos os refe- 
renciais para os quais valem as leis da mecânica. Vamos elevar esta conjectura. 

à categoria de um postulado, e vamos introduzir outro postulado, que é só apa- 
rentemente incompatível com o primeiro, a saber, que a luz sempre se propaga no 
vácuo com uma velocidade c bem definida, independente do estado de movimento 


da fonte emissora”. 
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6.3 A relatividade da simultaneidade 


Consideremos dois referenciais incrciais diferentes S e S’ (S° se desloca em 
relação a S com movimento retilinso uniforme). Podemos escolher as origens O e 
O” das coordenadas em S e S’ de tal forma que coincidam num instante que toma- 


mos como origem dos tempos, t = 1" = 0: 


= = (6.15) 


Suponhamos que, nesse instante comum, uma fonte puntiforme localizada em 
O = O” emite um sinal luminoso. Decorre então do postulado (B) que esse sinal se 


propaga em todas as direções com velocidade c em ambos os referenciais. Logo, a 


frente de onda num instante posterior é esférica em ambos os referenc ems é 
uma esfera de centro O; em S’ é uma esfera de centro O’. Aqui surge a aparente 
incompatibilidade a que Einstein se referiu: como é possível que a mesma esfera 
tenha dois centros diferentes? 

O paradoxo desaparece se não se tratar da mesma esfera. O que é uma frente de 
onda? Num dado referencial, é o lugar geométrico dos pontos atingidos pela onda 
simultaneamente nesse referencial. Se o que é simultâneo em relação a S não é 
necessariamente simultâneo em relação a S’, as frentes de onda nos dois referenciais 
são formadas de pontos diferentes, o que é compatível com centros diferentes. 

Einstein percebeu que a validade dos Princípios (A) e (B) exigia que fosse 
aprofundada a análise do conceito da simultaneidade de eventos em pontos distan- 
tes, quando analisada em referenciais diferentes. Como ele observa no seu trabalho 
de 1905, 

“Todos os nossos julgamentos com respeito a tempo são sempre julgamentos 
de eventos simultâneos. Por exemplo, quando se diz “O trem chega aqui às 7 h” 


isto significa: “A chegada do trem e a observação de que os ponteiros do relógio 
marcam 7 h são eventos simultâneos.” 

Até aí não há problema, porque as observações da chegada do trem e do reló- 
gio são feitas no mesmo lugar [como o disparo do sinal luminoso na (6.15)]. Mas 
como podemos saber que dois eventos que ocorrem em lugares diferentes, tais co- 
mo dois pontos P) e Pz, são simultâneos? 

Poderíamos dizer que isso ocorre quando cada evento coincide com uma lei- 


tura de relógio: 4 em P; e t em Po, e a simultaneidade significa que | = t. Mas 
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para isso é necessário que os relógios em P; e P» estejam sincronizados. Pode- 
ríamos imaginar diversos métodos para efetuar a sincronização 

Método 1: Enviando um sinal de P; a Pz 
T= 


ti = to, basta que o relógio em Pz, no momento da recepção do sinal, seja ajustado 


Se v é a velocidade do sinal e 


z» a distância de P, a P», sendo o sinal convencionado para ser emitido em 


para marcar h = f + À 

Mas como sabemos que a velocidade do sinal é v? A partir da medida do 
tempo que leva o sinal para se propagar entre dois pontos distantes, e esta medida 
pressupõe a sincronização. de modo que a definição é circular. 

Método 2: Os dois relógios podem ser sincronizados em P; e um deles, poste- 
riormente, transportado para P). Mas um relógio é um sistema físico, quer se trate 
de um pêndulo ou de um relógio atômico, baseado numa linha espectral emitida 
por um átomo. Como sabemos que a marcha do relógio não é afetada pelo trans- 
porte de P; a P2? Só poderíamos comprovar isso se já tivéssemos em Pz um relógio 
sincronizado com o de Pi, para compará-lo com o que foi transportado. Novamente, 
chegamos a um impasse 

Conclusão: Ao contrário da simultaneidade de eventos que ocorrem no mesmo 
ponto, a simultaneidade de eventos em dois pontos distantes não tem nenhum sig- 
nificado a priori: ela tem de ser definida por uma convenção. 


A definição de Einstein da simultaneidade de eventos distantes está relacio- 


nada com o método | acima e com o Princípio (B). que confere à velocidade da luz 
no vácuo o caráter de uma constante universal. Veremos logo que ela tem um 
significado mais amplo, representando uma velocidade limite para a propagação 


de quaisquer sinais. 


Definição de Einstein da simultaneidade: 


Se um evento 1 ocorre em P, no instante ty, sendo marcado pela emissão de 
um sinal luminoso que parte de P, nesse instante, e o mesmo vale para Pa em t 
(evento 2), dizemos que estes dois eventos são simultâneos (fi = t) quando o ponto 
de encontro dos dois sinais luminosos é o ponto médio do segmento Pi Po. 


Essa definição implica imediatamente que a simultaneidade de eventos distan- 


tes não tem caráter absoluto: dois eventos simultâneos num particular referencial 
inercial $ podem não ser simultâneos noutro referencial inercial S” que se move 


em relação a S com movimento retilíneo uniforme. 
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Fig. 6.5 Relatividade da simultaneidade 


Com efeito, suponhamos que os dois eventos sejam a queda de relâmpagos em 
Pı e Ps, e que cada um desses pontos coincida com uma extremidade de um trem 
(referencial S°), que se desloca com velocidade constante V em relação ao referen- 
cial S dos trilhos, suposto inercial. Cada relâmpago gera seu próprio sinal luminoso 
(fig. 6.5). Se os dois eventos são simultâneos em S, os dois sinais se encontram no 
ponto médio M de P, P2. Mas esse não é o ponto médio M’ do trem, porque M’, 
devido ao movimento do trem, recebe o sinal vindo de P, antes de receber aquele 
originário de P2. 

Na mecânica newtoniana, a posição de um evento já era um conceito relativo, 
dependente do referencial: dois eventos que ocorrem “no mesmo ponto” do trem 5” 
em instantes diferentes não ocorrem no mesmo ponto no referencial S$ dos trilhos. 


Assim, por exempo, um p 


ageiro que esquece a carteira no carro restaurante 
e volta depois para buscá-la encontra-a (se tiver sorte!) no “mesmo ponto” do trem, 
mas em pontos diferentes em relação aos trilhos. 

Entretanto. o instante de ocorrência de um evento era considerado como tendo 
caráter absoluto, o mesmo em qualquer referencial, o que também se aplicaria à 
simultancidade de cventos distantes: daí a relação 1” = f, na transformação de Ga- 
lileu. Newton escreveu nos “Principia” 

“O tempo absoluto, verdadeiro e matemático, por sua própria natureza, sem 
relação a nada externo, permanece sempre semelhante e imutável.” 

Esse caráter absoluto do tempo na mecânica newtoniana seria justificável se 
existissem sinais de velocidade arbitrariamente grande (“instantâneos”). Na prática, 
c é tão grande comparado com velocidades macroscópicas típicas que a mecânica 
newtoniana é, para fins práticos, uma excelente aproximação, 

Entretanto, vemos que a transformação de Galileu terá de ser substituída por 
outra em que as quatro ordenadas de um evento (x, y, z, 1) se transformam. 
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6.4 A transformação de Lorentz 


Para encontrar a transformação que deve substituir a de Galileu, convém ter 
uma imagem bastante concreta de um referencial onde se emprega a definição de 
Einstein da simultaneidade. 

O “relógio” atualmente empregado para definir a unidade de tempo já é um sis- 
tema físico bem definido (relógio atômico): baseia-se no período de oscilação de uma 
dada linha espectral emitida por um átomo, em repouso no referencial considerado. Co- 
mo c é uma constante universal, a unidade de comprimento se define em função da 
unidade de tempo (a distância percorrida pela luz numa unidade de tempo é o valor 
numérico de c). Essas definições são as mesmas em qualquer referencial. 

Uma forma concreta de pensar num referencial é então como uma estrutura ou 
arcabouço tridimensional onde as distâncias entre pontos de coordenadas inteiras são 
as” que medem uma unidade de comprimento, e em cada ponto existe um “re- 


todos os relógios sendo sincronizados de acordo com a definição de Einstein. 

Uma forma mais simples é imaginar uma estação de radar operando continua- 
mente. Num dado referencial basta então haver um único relógio. p. ex. na origem 
O, emitindo continuamente pulsos de radar. 

Para definir as coordenadas de um evento que ocorre num ponto P num dado 
instante nesse referencial, pode-se determinar o instante f2 em que um pulso emitido 
por O em & retorna a O como “eco” após atingir P. Nesse caso, o instante £ em que 
o pulso atingiu P é t = i (th + fı), e a distância OPéic(h—h);a direção OP 
também pode ser determinada, fornecendo assim as quatro coordenadas do evento. 
Essas coordenadas são consistentes com o critério de Einstein de simultaneidade. 

Vamos considerar primeiro um caso especial, em que escolhemos o eixo dos x 
na direção do movimento relativo entre os dois referenciais inerciais e é satisfeita 
a (6.15) (origens coincidentes em t = +" = 0). 


y (8) E (8) A transformação 


seguintes condiçõe 


(i) Um movimento retilíneo uniforme 
em relação a (S) também deve ser reti- 
Fig. 6.6 Referenciais (S) e (8) lineo e uniforme em (5°). 
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Gi) Para V=0 (V=V * é a velocidade de S” em relação a S), a transfor- 
mação deve reduzir-se à identidade [porque vale a (6.15) e escolhemos as mesmas 


unidades de medida em Se 5°]. 


(iii) Se um sinal luminoso é enviado de O = O’ em it = = 0,a sua frente de 


onda deve propagar-se com velocidade c em ambos os referenciais. de modo que 


(cada uma dessas equações deve implicar a outra). 


Pode-se demonstrar que uma transformação que satisfaz essas condições é, ne- 


cessariamente, uma transformação linear. Vamos admitir esse resultado. 


Transformação de comprimentos Iransversais 


Seja AB um segmento do eixo y com centro em O e de comprimento = 
6.6). Pela definição 
de Einstein, A’ e B’ cruzam o eixo y simultaneamente em S; analogamente, A e B 


A'B’ um segmento com as mesmas características em §” (fi 


cruzam o cixo y’ simultaneamente em S”, e ambos os eventos ocorrem em 1 = 1" = 0. 
Nesse instante, (ou mais tarde, se os cruzamentos deixarem registros permanentes 
nos eixos y.y'). os comprimentos AB e A'B” podem ser comparados. 

A única conclusão possível é que eles são iguais: qualquer outra violaria o 
princípio de relatividade. Com efeito, se em S se verificasse que A'B”, devido ao 
movimento, é, p. €x., < AB, a relatividade exigiria que AB, que está em movimen- 


to visto de S’, é < A'B”, o que seria uma contradição (devido ao fato de que a 
AB”, 


comparação é simultânea em ambos os referenciais). Logo, tem de ser AB 


o que se aplica a comprimentos transversais à direção x do movimento: 


| i | (6.17) 


Note, porém, que o raciocínio não se aplica a comprimentos longitudinais, ou seja, 
paralelos à direção do movimento, porque neste caso, como vimos acima (Seç. 6.3), 
posições dos extremos de um segmento que são simultâneas em relação a (S) não 
são simultâncas em relação a ($ ). 

Como a origem O’ (x° = 0) de (S°) deve ter a coordenada x = Vt em (5), 
deve ser (relação linear) 


x =A(r-Vt) (6.18) 
Por outro lado, a transformação de +” deve ser linear: 
f=Bt+Cx (6.19) 


onde não há termos adicionais em y e z (tipo + Dy + Ez) porque a única direção 
privilegiada (direção do movimento) é a direção x ; termos adicionais violariam a 
isotropia do espaço, definindo uma outra direção privilegiada. 

É imediato que a transformação definida pelas (6.17) a (6.19) satisfaz as con- 


dições (i) e (ii) acima. Resta impor a condição (iii): sempre que 


g (6.20) 
devemos ter 
=" +93" + =A -Vi +3 +2 -e (BI+CI) 
=R (e -2rVt+ V P) + - (Pe IBCC 
= (6.21) 


=(@ -ee -1) 


+(e P-e Py 


-2V + BC)r+ 
quaisquer que sejam x c t. 


Isso só é possível se os coeficientes forem identicamente nulos, o que dá 


AV+ČBC=0 


Æ =e =1 (622) 


A primeira equação dá 


PR To | (6.23) 
w j 


A 
Substituindo nas duas outras, vem 


-eCtervo)= 
c TB + = 


| (6.24) 
B'+VBC=B(B+VC)= ! 
e, substituindo este resultado na (A 23), 
| (6.25) 
Levando na última (6.22), 
É do É 
aê (1 a =) =1 . (6.26) 
| e 
(627) 
i V 
A=S+B=ty 4 C=-48 (6.28) 


Mas, pela condição (ii), tem de ser A =B= [ec C=0 para V= 0 (quando 
y= 1). Logo, 


| E ag 
|A =B =Y 


| (6.29) 


o que leva univocamente à TRANSFORMAÇÃO de LORENTZ ESPECTAL 


(6.30) 


Para que y seja real, tem de ser B < 1. Isso sugere que c seja não apenas a 
velocidade da luz, mas também uma velocidade limite, no sentido de que nenhum 
referencial deve poder mover-se com velocidade V > c. Isso será confirmado mais 
tarde. 

Se resolvermos o sistema de equações lineares (6.30) em relação a (x, Yy, 2,1), 
resulta (verifique!) 


x=v(e+vo) 
y 


=y) é e 


que só difere da (6.30) pela substituição V —> — V. Logo, (S) se move em relação 


Transf. de Lorentz 6.31) 
especial inversa 


a(S’) com velocidade (— V), o que não é uma conclusão trivial. 


A transformação de Galileu como caso limite 


Se B << 1, temos [cf.(6.13)] 


e. para x << ct, as (6.30) se reduzem à transformação de Galileu, a menos de 
termos de 2* ordem em B = V/e, que são extremamente pequenos para veloci- 
dades V usuais. 

A transformação de Lorentz também se reduz à de Galileu no limite formal em 
que se faz c — œ. Como já foi mencionado, se existissem sinais “instantâneos”, de 
velocidade infinita, a simultaneidade de eventos distantes teria caráter absoluto e 
valeria a transformação de Galileu, 


Transformação de Lorentz geral 


A partir da TL (transf. de Lorentz) especial, é fácil obter a expressão de uma 
TL geral, em que a velocidade V de ( $’) em relação a (S) tem direção arbitrária. 
Para isso, basta decompor o vetor de posição de um ponio P numa componente 
// N, que se transforma como x na TL especial, e numa componente L V, que se 
transforma como as coordenadas (y, z) na TL especial. 

A componente paralela se obtém projetando na direção de V. Seja Vo versor 
da direção V: 


(6.33) 
Temos então 
(6.34) 
E SEM =x- 6- Ý) 
e analogamente para x’. As equações da TL geral são: 
zi =r64-V2) 
[mi TL GERAL (6.35) 


Nessa transformação, mantivemos a mesma orientação espacial dos eixos em 
(S) e (S°). Naturalmente, podemos ainda efetuar transformações puramente es- 
paciais (translações da origem e rotações dos eixos) sem afetar o caráter iner- 
cial dos referenciais. 


6.5 Efeitos cineméticos da TL 


A TL dá origem a uma série de efeitos que são puramente cinemáticos, ou 
seja, não envolvem a formulação relativística das leis da dinâmica. 
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(a) À contração de Lorentz 


Chama-se valor próprio de uma grandeza física o valor dessa grandeza me- 
dido num referencial onde o objeto ao qual está associada encontra-se em repouso. 

Consideremos então uma barra que está em repouso ao longo do cixo O 'x' em 
(S°), com suas extremidades nos pontos x € x. O comprimento próprio da barra 
é então 


b=- | (6.36) 


Como definimos o comprimento ! da barra em (S), uma vez que ela está-se deslo- 
cando com velocidade V em relação a (5)? 

Sex (1) ex (1) são os pontos de (5) que coincidem com as extremidades da 
barra no mesmo instante 4 em (S), ou seja, simultaneamente em relação a (S), o 
comprimento 7 em S é definido como 


l (6.37) 
onde xı (f) e x2(t) são dados pela TL (6.30) 
xE =y& va) E” 
; o 24 
xE) =y -vt Ta 
ou seja, j 
1-Bº 4 
rr (6.38) 


Assim, o comprimento da barra em movimento é menor que seu comprimento 
próprio. Esse efeito já havia sido sugerido por Lorentz e por FitzGerald antes da 
teoria da relatividade para explicar o resultado nulo do experimento de Michelson 
e Morley. mas sem justificá-lo. 

Convém notar a diferença entre comprimentos longitudinais e transversais a V: 
vimos na fig. 6.17 que comprimentos transversais não se alteram, porque podem 
ser determinados simultaneamente em ambos os referenciais. No caso longitudinal, 
o que é simultâneo em ($) não é simultâneo em ( S’), o que é a razão da diferença. 


Se consideramos um volume, como as dimensões transversais não se alteram, 
o volume próprio vo aparece contraído quando medido em movimento: 


A contração é um efeito recíproco: uma barra em repouso em (S) também aparece 
contraída quando seu comprimento é medido em (5°) , como tem de ser pelo prin- 
cípio de relatividade ( V > — V). 


Embora o conceito de simultaneidade en- 


——» — tre na definição do comprimento da barra 

em movimento, a contração pode ser de- 

i Tr: sem o auxílio de relógios, confor- 

A, B, A, B, me Einstein observou. Basta considerar 

(fig. 6.7) duas barras Aı B; e AB; de 

Fig. 6.7 Deteção da contração de Lorentz mesmo comprimento próprio l que se 
sem relógios 


movem, em relação a ($), em sentidos 
opostos, com velocidades v e — v. Por simetria, as extremidades se superpõem (Az 
com A, e Bz com B:), simultaneamente em (S), coincidindo neste instante com dois 
pontos A e B de ($). A distância AB em (S) é 1 = lo V1 — B”. Vemos portanto 


que a contração não é uma propriedade de uma única barra, mas uma relação recf- 


proca entre duas barras em movimento relativo entre si. 


O aspecto visual de objeios em movimento 

Em livros de divulgação sobre relativida- 
de, encontram-se muitas vezes figuras co- 
mo a fig. 6.8, procurando representar o as- 
pecto visual de um automóvel (p. ex.) em 
movimento com velocidade relativística, 
achatado pela contração. Será que se ob- 


servaria mesmo dessa forma a aparência 


visual de um objeto em movimento com 


velocidade suficientemente elevada? 


Fig. 6.8 Versão popular da contração de Lorentz 


A resposta, mostrando que a figura 6.8 é inteiramente falsa, só foi dada em 
1959 por J.Terrell. 


* J Terrel), Phys. Rev. 116, 1041 (1959); V. F. Weisskopf, Phys. Today 13, 24 (1960). 


194 


A razão é que a imagem de um objeto, quer na retina, quer numa chapa fotográfica, 
é formada por raios de luz que chegam essencialmente ao mesmo tempo para formar a 
imagem, mas, por isto mesmo. partiram do objeto em instantes diferentes, conforme o 
ponto de onde provêm. Devido ao movimento do objeto, não temos então uma repre- 
sentação “instantânea” dele, mas sim uma imagem distorcida. representando a posição 
de diferentes pontos em diferentes instantes (em relação a S). 


Surpreendentemente, para objetos que subtendem um ângulo visual pequeno, a 


contração de Lorentz-Fitzgerald corrige uma distorção que apareceria se ela não 
existisse, e fornece uma visão do objeto com sua aparência “normal” (a mesma que 
tem em repouso). tendo apenas o efeito equivalente a uma rotação. 


Para ver como isso acontece, conside- 
remos um cubo de aresta = 1 unidade 
de comprimento que se move na dire- 
(a) ção de uma aresta, com velocidade V, 
e está sendo observado desde uma dis- 
tância muito grande (ângulo visual pe- 
queno, raios de luz quase paralelos) 
numa direção | ao movimento [fig. 
6.9(a)]. Os pontos da face A'B'C'D” 
são equidistantes do observador, de 
modo que na física não-relativística 
(N.R.). ela aparece ao observador co- 
mo um quadrado de lado 1. Entretan- 


(b) 


to, para a face A'B'E'F”, perpendicu- 
lar a V, luz da aresta E'F “deixou o 
cubo E'B'/c = 1/c segundos antes 
(0) da luz provemente de A'B”, para che- 

gar ao observador ao mesmo tempo. 
— Assim, deixou o cubo quando EF” 


estava na posição E” F7” [fig 6.9(a)], 


seng cos6 k 4 
uma distância V/c para trás, de forma 


Fig. 8.9 Aspecto visual de um cubo em movimento — one a face ABEF aparece como um re- 


tângulo de altura 1 e base V/c [fig. 6.9(b)]. O resultado se assemelha à vi 


perspectiva de um paralelepípedo alongado, não de um cubo. 
A contração de Lorentz faz com que AD e BC apareçam com comprimento em 
(5) igual a V1- V 


sem alterar a visão da face ABEF transversal ao 
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6.5 Eeios 


movimento. O resultado [fig. 6.9(c)] é a imagem em perspectiva de um cubo (a 
distorção é eliminada) que sofreu uma rotação por um ângulo 8, onde 


(6.40) 


vV 
send=— , cosĝ= 
c 


Da mesma forma, pode-se mostrar que uma esfera não é vista como um esferóide: 
permanece com a aparência visual de uma esfera devido à contração de Lorentz. 
Vejamos agora o efeito da TL sobre intervalos de tempo. 


(b) A dilatação dos intervalos de tempo 


Consideremos um relógio em repouso em ( S^), p. ex., na origem O” das coor- 
denadas. O tempo 1 marcado por esse relógio é portanto rempo próprio, e vamos 
representá-lo por T. 

A coordenada tempo f correspondente em (S ) obtém-se da FL inversa (6.31) 
fazendo x’ = 0: 


t=yf=7t (6.41) 


de forma que a relação entre intervalos de tempo At em (S) (tempo próprio do 
relógio em repouso) e os intervalos de tempo correspondentes em (S ), onde o 
relógio está em movimento, é 


F 


(6.42) 


Daí o nome de dilatação dos intervalos de tempo dado a essc efeito. 


Da mesma forma que para os comprimentos, o efeito é recíproco: um relógio 
em repouso em (S) marca intervalos de tempo maiores em (8). O efeito é con- 


trário ao dos comprimentos, porém: o movimento contrai os comprimentos. mas 
dilata os tempos. 

Como detetar o efeito? O relógio de ( S’), por hipótese, está sincronizado com 
o de (S ) na origem comum: 7 =1'=0Oparax=x"'=o0. Decorrido um tempo t’ 
em ($°), o relógio em O” está passando por um outro relógio em (S ) e podem-se 


comparar as leituras; a leitura em (S) será 1, dado pela (6.41). Logo, o efeito resulta 
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de comparar um único relógio em ($) com dois relógios diferentes em (S), sin- 
cronizados segundo o critério de Einstein. 

Uma confirmação experimenta! de grande impacto desse efeito é a desinte- 
gração dos muons (mésons y) dos raios cósmicos, partículas carregadas análogas 
aos elétrons mas de massa cerca de 200 vezes maior, que se desintegram segundo 
o esquema 


T 


antineutrino do e | neutrino do p 


Observando a desintegração de muons em repouso no laboratório, pode-se me- 
dir sua vida média Tą , que é = 2,2 X 10% s 


Sabe-se, por outro lado, que muons são produzidos quando raios cósmicos 
colidem com núcleos ao penetrar na atmosfera da Terra, e uma fração apre- 
ciável deles chegam até a superfície. Ora, durante uma vida média, mesmo 
viajando com velocidade v ~ c, um muon percorreria uma distância 
“Ci ~ 3 x 10° x 2,2 x 10%m ~ 660m, em lugar de distâncias > 10 km, como 
ocorre quando são produzidos na alta atmosfera. Como se explica a observação de 
uma fração apreciável dos muons após um número tão grande de vidas médias? 

A explicação é dada pela dilatação dos intervalos de tempo. A vida média w 
é um tempo próprio, no referencial de repouso do muon. Em relação à Terra, mui- 
tos muons se movem com velocidades relativísticas, tendo V/c > 0,995, o que cor- 
responde a um fator de dilatação temporal y > 10. A vida média no referencial da 
Terra passa a ser > 2,2 x 10?s e os muons podem penetrar através de > 6,6km 
de atmosfera durante uma vida média, o que explica os resultados observados. 

Ubtemos uma explicação equivalente deslocando-nos para o referencial do 
muon, onde a vida média é tą. Entretanto, para um muon com V/c > 0,995, é a 
espessura da atmosfera que sofre uma contração de Lorentz por um fator y > 10, 
levando ao mesmo resultado. 


6.6 A lei relativistica de composição de velocidades 


Consideremos uma partícula em movimento arbitrário em relação a ( S’), com 


xe), yE) z 


ze) (6.43) 


dx dy _ dz 
O dt dé 


onde x(t) , y(t), z(t) estão relacionados com x’ (1). y’ (t°), 


TL (6.30) (tomamos x 4 F). 
Resulta então das (6.30) que 


dx =y(da-Vdt) , dy =dy,dz =dz 


` 
ar = yfar- Zax] 
A 


o que implica 


g Es REM 
o PE y 
: 
an 
CES 
di = BE dy = VW = 


ar rafi- 5] 


(6.44) 


(6.45) 


”(t°) pela 


(6.46) 
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As (6.46) dão a lei relativística de composição de velocidades. Se 
lvi<<c,V<<c, ela se reduz à lei de Galileu (6.2). a menos de pequenas cor- 
reções (exatamente, quando c —> e). O caso geral, em que V tem uma direção 
qualquer, obtém-se, por um método análogo, das expressões (6.35) da TL geral 


(vo > vi >v- V) 

x Também podemos interpretar as (6.46) de 
z4 (8) / e y% forma diferente (fig. 6.10). A partícula P 
Po se move em relação a ($) com velocidade 
v. Podemos considerar em (S ) outra par- 
a y tícula O” que se move, em (S), com velo- 
g cidade V, e perguntar: qual é a velocida- 
£ de relativa da partícula P em relação à 

Fig. 8.10 Velocidade relativa partícula O’? 


Na mecânica newtoniana, essa velocidade relativa é dada por v’ = v — V, 
como consequência da transformação de Galileu (6.2). Daí seguiria que, se duas 
partículas se movem em sentidos opostos com velocidades c e —c, a sua velocidade 
relativa seria 2c; vemos que esta definição não é aceitável. 

Entretanto, a definição correta da velocidade relativa de P em relação a O” é: 
a velocidade v’ de P em relação a um referencial (S”) onde O” está em repouso. 
Vemos então que a velocidade relativa v’ é dada precisamente pelas (6.46). 


Decorre das (6.46) (a demonstração será deixada como problema |Probl. 6.4]) 
que 


(6.47) 


Uma consequência importante desse resultado é que, se as magnitudes de duas 
das velocidades v , v’ e V são < c, o mesmo vale para a 3º : a composição de 
duas velocidades menores que c, relativisticamente, nunca pode levar a uma resul- 
tante maior que c. Em particular, se v — c, o mesmo vale para v’, mesmo que 
IV tenda a c. 
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6.7 Intervalos 


Consideremos dois eventos 1 e 2, que ocorrem nos “pontos do espaço-tempo” 
(&,h) e (o.b). respectivamente, em relação a um dado referencial (S). Sem 
restrição da generalidade, podemos supor que xı = 0 e 4 = 0, tomando o evento | 


como origem das coordenadas e do tempo, e escrever: 


Tanto x como 1 são grandezas relativas, isto é. dependentes do referencial, 
mas existe uma grandeza associada às coordenadas espaciotemporais dos dois even- 


tos que é invariante, tendo o mesmo valor em qualquer referencial inercial: 


CETE (648) 
Com efeito, com a escolha de origem feita, 
Cof =x (649) 


c as equações da TL foram obtidas precisamente impondo a condição de que essa 
grandeza tenha o mesmo valor em qualquer referencial inercial [o fato de que este 
valor fosse = O não entrou na (6.21)] 


A grandeza invariante por TL (sr). que pode ter qualquer sinal 
(>0,< 0 ou = 0), chama-se o quadrado do intervalo entre os eventos 1 e 2. 
Vejamos agora, sempre adotando um dos eventos como origem, como na (6.49), a 
interpretação física do sinal de (sa), que tem um caráter absoluto, pois é o mes- 


mo em qualquer referencial inercial. 


© Go) <o 


Nesse caso, escrevemos 


(6.50) 


de modo que a distância entre os pontos onde ocorrem os dois eventos é menor do 
que aquela que seria percorrida por um sinal luminoso durante o intervalo de tempo 
t que os separa. Isso implica que é possível enviar um sinal de um evento ao outro, 
de forma que um deles pode ser a causa do outro. 

lidades: (1) t > Ixl/c: 2 ocorre depois de 1 e 
pode ser causado por 1; (ii) 1 < — Ix l/c: inverte-se a ordem temporal entre 1 e 2. 


A (6.51) admite duas possi 


Consideremos um referencial (S?) que se move em relação a (S) com veloci- 
dade V; pela TL geral (6.35), 


f 
r=yjr (6.52) 
k 
Temos 
ou, como IV /cl=B, 
IV- 
PES < sh (6.53) 
= 


onde usamos a (6.51). 

Comparando com a (6.52), e com B < 1 (Iv! < c), vemos que (i) 
t>0 > 1" >0;(0D)Di<O0 > 1'<0. 

Logo, no caso (i), o evento 2 ocorre depois do evento 1, em qualquer referen- 
cial com B< 1, isto é, está no futuro absoluto de 1, o que é consistente com o 
fato de que 1 pode ter causado 2. No caso (ii). o evento 2 ocorre antes do evento 
1 cm qualques referencial com P < 1, ou seja, está no passado absoluio de l, 
podendo portanto ter sido a causa de 1 

Vemos agora por que c não é apenas a velocidade da luz no vácuo, mas tem 
de ser a velocidade limite de propagação de qualquer sinal e de movimento de 
qualquer referencial: se assim não fosse, se admitíssemos a possibilidade de 
B > 1, seria possível violar o princípio de causalidade, invertendo a sucessão de 
causa e efeito! (Morrer antes de ter nascido, por exemplo). 

Podemos mostrar também que, para (sp) < 0. sempre existe um referencial 
inercial onde os eventos | e 2 ocorrem no mesmo ponto do espaço. 

Com efeito, na TL geral (6.35), 


(6.54) 
His — Hi. 
Se escolhermos V / x, será xı = 0, e basta tomar 
x r 
yez Gx =0=x) (6.55) 
o que é possível porque |V | = Ixl / Lil < c. Esse é o referencial que sai de 1 no 
instante O em que 1 ocorre e chega a 2 no instante f da sua ocorrência. 
Nesse referencial, como x” = 0, 
G) == (23) =="; d =] (6.56) 


mostrando que T é o intervalo do tempo entre os eventos 1 e 2 num referencial 
onde eles ocorrem em repouso (no mesmo ponto O), ou seja, T é o intervalo de 
tempo próprio entre os 2 eventos (marcado por um relógio em repouso). Dizemos 


nesse caso que a separação entre eles é do gênero tempo. 


6) a) >0 


Nesse caso, em lugar da (6.51), teremos 


[x| > cr l -Hci (6.57) 


de modo que nenhum sinal com velocidade < c pode ligar um evento ao outro: um 
dos eventos não pode ser a causa do outro. 

Nessas condições, sempre existe um referencial onde os dois eventos são si- 
muitâneos. Com efeito, para que seja [cf.(6.52)] 


basta tomar V / xe 


(6.58) 


Nesse referencial, 


Gd = 8-4 == 


(6.59) 


é a distância própria entre os dois eventos. 
Um intervalo desse tipo diz-se ser do gênero espaço: os dois eventos têm uma 
separação do gênero espaço, ou ainda, são absolutamente separados. 


Conforme tomemos |V | maior ou menor que o valor (6.58). podemos encon- 


trar 1/< 0 ou ?'> 0. Logo, nesse caso, dizer que um evento ocorre “antes” ou 
do outro é um conceito relativo: depende do referencial. Isso é consistente 
com a inexistência de relação de causa e efeito entre eles. 


“depois 


Um exemplo de dois eventos com separação do gênero espaço é o da queda 
dos relâmpagos (simultânea no referencial dos trilhos) nas duas extremidades de 
um trem (Seç. 6.3): conforme o trem se mova para a frente ou para trás, qualquer 
um dos dois eventos pode ser visto como ocorrendo antes do outro, no referencial 
do trem. 


© Gj=0 


Neste caso, 


i|] (6.60) 


e os dois eventos podem ser ligados por um sinal luminoso. Diz-se que a separação 


entre eles é do gênero luz (um está no cone de luz do outro). 


A (6.60), no espaço-tempo quadridimensional, é a equação de um cone. o cone de luz, que copta o plano 
(a, £) num par de retas de coeficiente angular +. A Linha de universo de uma partícula livre (sua trajetória 
no espaço-tempo) é uma reta (coeficiente angular | v | < c) contida dentro desse cone (cf. fig. 6.20) 
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6.8 O efeito Doppler 


O fator de propagação de uma onda eletromagnética plana monocromática no 
vácuo é 


RÃ | 
= exp -ofe £ a] = exp (27iF)| (6.61) 
& | 


onde 


(6.62) 


tem uma interpretação física simples. 

Com efeito, suponhamos que, para t = 0, a origem O de um referencial (S) 
esteja sendo cruzada por uma crista de onda. Essa crista atinge o ponto x no ins- 
tante 


t = @-x)/c (6.63) 
Se escolhermos 1 de tal forma que F na (6.62) seja um número inteiro, este número 


F=v(t- (6.64) 


é então o número de cristas de onda que cruzaram a origem depois de t = Ù e 
atingem x entre ty e o instante t. Assim, F = l para f — fo = T = 1/v (um pe- 
ríodo), F=2 para t- t) = 21, etc.. 

Seja agora ( S’) um outro referencial inercial que se desloca cm relação a (5) 


com velocidade V na direção x, e tal que O = O” para íf = t° = 0. 


Se (x”,t”) corresponde a (x ,1) em ($°), 


] =v -4) (6.65) 


* 


c 


é o número de cristas de onda que cruzaram x” [mesmo ponto P em ($')] depois 
daquela que passou por O’ = O em 1" = t = 0, entre os instantes fọ (correspon- 
dente a to) e £’. Esse número tem de ser idêntico a F, porque a primeira e a última 


frente de onda se correspondem em ambos os referenciais [as coordenadas do even- 
to “cruzamento da última” são (x ,i)em(S)e(x',1)em (S')], e o número de 
cristas entre os dois eventos tem um sentido absoluto (tem de ser o mesmo em 
ambos os referenciais): também poderíamos tomar o número de zeros do campo 
eletromagnético, E = B = 0, que tem caráter absoluto. 

Logo, 


(6.66) 


ou seja, a fase de uma onda eleiromagnética plana monocromática é uma grandeza 
invariante. 


Fig. 611 Efeito Doppler e aberração 


Suponhamos, para simplificar, que o ponto P, de coordenadas x em (S) e x” 
em ($), está no plano (x y), de forma que (fig. 6.11) 


&=(cs0,sen6,0) ;  & = (cos 8’, sen 8, 0) (6.67) 
Temos então 


7 Ž cos — À sen o) (6.68) 
e c 


z cos 6 (x +V r)- 


-Y sen8y (6.69) 


que, pela (6.66), tem de ser idêntica à (6.68) quaisquer que sejam t’, x’ cy”. 
7 


Isto só é possível se os coeficientes forem idênticos, o que dá, com — 
A 


| yv Q- B cos8) (6.70) 


que é a expressão relativistica do efeito Doppler. 

Também se pode obter dessa forma a relação entre as direções de propagação 
9” e 0, que são diferentes devido à relatividade da simultaneidade [frentes de onda 
em (S ) não coincidem com frentes de onda em (S” ]. Essa variação de direção 
corresponde ao fenômeno da aberração, que desloca a posição aparente das estre- 
las. O efeito astronômico foi primeiro observado por Bradley em 1728. A relação 
entre 0” e O será deixada como exercício (Probl. 6.5). 

Voltando ao efeito Doppler relativístico para a luz, é interessante comparar a 
(6.70) com os resultados análogos da física não-relativística na acústica, obtidos 
em Fís. Bás. 2, Eq. (6.9.11) e Probl. 6.16. Para adaptá-los à notação atual, é pre- 
ciso trocar neles V > — V , pois V é para nós a velocidade do observador em 
relação à fonte, c lá foi tomado como velocidade da fonte em relação ao ob- 
servador. 


Na acústica, a definição de À seria, 


B=V/v (v= veloc. do som no ar em repouso) (6.71) 


eé preciso considerar duas situações diferentes: 


Fonte em repouso na atmosfera 
Observador cm movimento com iv= vol -B cos6) (6.72) 


velocidade V na direção 8 


Observador em repouso na stm. 
(6.73) 


Fonte em movimento com 


velocidade V na direção @ 


onde vo é a “frequência própria” da fonte em seu sistema de repouso. 

No caso da acústica, as duas situações dão resultados diferentes, porque existe 
um referencial privilegiado: aquele em que a atmosfera está em repouso. Para 
0 = 0, pex.cB<<1, 


Fonte em repouso { v=v (1-8) 


(6.74) 
Yo 
1+B 


=v -B+B -..) 


Observador em repouso f v= 


vemos que as duas expressões diferem por termos de 2.* ordem em B. Por outro 
lado, para observação transversal (0 = 1/2), não há efeito Doppler acústico: 
v = Vo nos dois casos. 

O efeito Doppler relativístico para a luz, dado pela (6.70). só depende da velo- 
cidade relativa V do observador com respeito à fonte, como tinha de ser. Para 
8=0, 

= 1 

tg Er (6.75) 


Se existisse o éter como referencial absoluto, elc desempenharia o mesmo pa- 
pel que a atmosfera para o som, e teríamos de distinguir entre os dois casos. Aliás, 
as (6.72) e (6.73) também resultariam da (6.66) se aplicássemos a transformação de 
Galileu em lugar da TL (Probl.6). 
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O efeito relativístico (6.70) só difere da (6.72) pelo fator y = (1 =- B)72, 
que representa o efeito cinemático da dilatação dos intervalos de tempo. No caso 
relativístico, esse fator persiste para observação transversal. 


= 7 EFEITO 
J v | DOPPLER (6.76) 
TRANSVERSAL 


A observação é difícil, não só por ser um efeito de 2. ordem, mas também 
porque um pequeno desvio da direção @ = 7/2 introduz correções adicionais de 
ordem B . Entretanto, uma observação direta foi feita por W. Kundig em 1963, 
usando raios y de uma fonte radioativa colocada no rotor de uma centrífuga em 
alta rotação. Os resultados confirmaram inteiramente a (6.76), e podem ser consi- 
derados como outra verificação experimental do efeito de dilatação dos intervalos 
de tempo. 

Quando se compara o espectro da luz proveniente de uma galáxia distante, 
onde é possível identificar linhas de absorção características (cf. Seç. 7.6) (p. ex., 
duas linhas de absorção devidas ao cálcio ionizado), com as mesmas linhas num 
espectro terrestre, verifica-se que os comprimentos de onda na luz proveniente da 
galáxia sofreram um desvio para o vermelho (v' < V) 

Em 1929, o astrônomo americano Edwin P. Hubble propôs a hipótese arrojada 
de que esse desvio seja devido ao efeito Doppler, com a galáxia observada se afas- 
tando de nós com um dado valor de f, determinado pela (6.75) a partir de v’/v. 

A aplicação da idéia de Hubble a um grande número de galáxias mostrou que 
a velocidade de recessão V é proporcional à distância y da galáxia à Terra: 


[v= Hr] (6.17) 


onde Ho se chama a constante de Hubble. O valor de Ho teve sua determinação mais 
recente em 2003, a partir de observações efetuadas pelo satélite WMAP (Wilkinson 
Microwave Anisotropy Probe), resultando ser igual a 71 (+4) km/s por Mpe (1 Mpe 
= 1 Megaparsec = 10º pc; | pe = 3.6 anos-luz). 

O resultado de Hubble foi a primeira indicação de que o Universo não é estáti- 
co, encontrando-se em expansão; voltaremos a discutir este resultado mais adiante 
(Seç. 6.13). 
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istivicade 


Após substituir a cinemática newtoniana, bascada na transformação de Gali- 
ica (TL), é preciso reformular a dinãi 
para que seja compatível com a nova cinemática. 


ica newtoniana 


leu, pela cinemática relativ 


Esperamos que, de conformidade com a experiência, a mecânica relativística 
se reduza à mecânica newtoniana, com muito boa aproximação, quando rodas a 


velocidades envolvidas forem << c. 

Entretanto, já aparece uma diferença básica se perguntarmos que tipos de for- 
gas podemos considerar. Na mecânica newtoniana, admitem-se forças de interação 
entre partículas que ficam inteiramente determinadas pela suas posições (distân- 
cias) instântaneas, tais como a gravitação, dada pela lei de Newton da gravitação 
universal. 

Tais forças são inadmissíveis na mecânica relativística: o conceito de “posi- 
ções simultâneas” das partículas de um sistema depende do referencial, e a veloci- 
dade limite de propagação das interações é c. 

Entre as interações fundamentais, podemos admitir as eletromagnéticas, cuja 
formula 


ção é compatível com a relatividade; a velocidade de propagação no vácuo 
das interações eletromagnéticas é c . 

Um outro tipo de interação, descrita fenomenologicamente, a nível macros- 
cópico, que podemos admitir, são forças de contato, que atuam apenas quando 
duas partículas entram em contato numa colisão, e podem ser idealizadas como 
atuando apenas no instante e no ponto de contato. sendo portanto compatíveis 
com a relatividade. 

As leis da dinâmica relativística, como as leis da dinâmica newtoniana, não 
podem ser “deduzidas”. Procuraremos chegar a elas de forma heurística, usando 
forças de contato e admitindo a validade geral de leis de conservação, que, como 
sabemos, englobam alguns dos princípios mais básicos da dinâmica. 

Há outra forma de inferir essas leis utilizando de forma sistemática o forma- 
lismo covariante, que garante automaticamente a compatibilidade com o princípio 
de relatividade, mas as limitações deste curso não permitirão desenvolvê-lo aqui 
(cf. Seç. 6.12). 

Qualquer que seja a abordagem, a justificativa final das leis inferidas para a 
dinâmica relativística encontra-se no seu acordo com a experiência. 

O princípio básico do qual vamos partir é o da conservação do momento num 
processo muito simples de colisão elástica entre duas partículas idênticas Jeste mé- 
todo é devido a G. N. Lewis e R.C. Tolman (1909)]. 
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Na mecânica newtoniana, o momento de uma partícula é definido por 


p = my = m (6.78) 


onde v é o seu vetor velocidade e m uma grandeza escalar que se admite implici- 
tamente ser uma característica invariável da partícula, sua massa inercial. 

Vamos admitir que na mecânica relativística o momento seja da mesma forma, 
proporcional a v, mas vamos admitir maior generalidade para o coeficiente m; con- 
tinuará sendo um escalar, mas não necessariamente invariável: pode depender da 
única grandeza escalar associada a v, a magnitude v = | v | da velocidade: 


(6.79) 


de forma que 
p= m()r (6.80) 


Vamos chamar de a e b as duas partículas idênticas (podemos imaginá-las 
como duas bolinhas), e vamos adotar um referencial ( S°) (referencial do CM) em 
que o momento total do sistema se anula antes da colisão (portanto também de- 
pois), e no qual ela tem lugar num plano, que escolhemos como (x”, y’) ; O efeito 
da colisão consiste em inverter as componentes da velocidade das partículas ao 
longo de um eixo, que escolhemos como y”, sem alterar as componentes x”. 


y As componentes x” e y” das veloci- 


dades das partículas a e b em ( S’) an- 
tes e depois da colisão estão represen- 


b (antes) 


b (depois) 


tadas na Tabela 1, conforme a fig. 
6.12, onde 


A 
| 
| 
| 
| 
| 
| 
| 


(6.81) 


a (antes) 


tem o mesmo valor para ambas as par- 
tículas, antes e depois da colisão [lo- 
ig. 6.12 Colisão elástica go, também 7n (v) ). 


asi 
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TABELA 1 


onentes das velocidades em (S”) antes e depois 


x > x > 
Antes vê y -vy 
Depois vz = -3 v 


Particula a Partícula b 


Pela (6.80), o momento total é = O antes e depois, qualquer que seja a forma 
da função m (v) , de modo que a lei de conservação do momento é satisfeita no 
referencial ($°). 

Pelo Princípio de Relatividade, o mesmo deve valer em qualquer outro refe- 
rencial inercial. Seja então (S) um referencial em relação ao qual ($) se desloca 
na direção x com velocidade V; as componentes das velocidades em relação a (S ) 
resultam da lei relativística (6.46) de composição de velocidades aplicada à TL 
inversa (V —> —V), o que dá, partindo da Tabela 1, os resultados da Tabela 2. 


TABELA 2 (B = V/c) 


f 
| Componentes das velocidades em (S) antes è depois da colisão | 
| 
$ 


Componente P. ; x s | 

+V ii 

tio, A Gaa i AN x] 

Ames pieve raen Le | 

puro | pi- À 

| Que +V) — N | 
Depois Pi + og Vse] És Cw tv) KEET 


LARVAE EI- WV H- ETAT 


| Particula a Partícula b 


O módulo v, da velocidade da particula a antes e depois da colisão é o mesmo, 
e o mesmo vale para a velocidade vs, da partícula b, mas va Æ vs. A conservação 
do momento em (S) se escreve: 
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[r Gjura) + medos [m gjerat) +] depois (682) 


o que é automaticamente satisfeito para a componente x. Para a componente y, pela 
Tabela 2, a (6.82) dá 


(6.83) 


o que só pode ser satisfeito para valores arbitrários de vc e vy se ambos os mem- 
bros forem identicamente nulos, ou seja, 


m(va) E ts 
me) 1 


(6.84) 


(6.85) 


(6.86) 


ugão à relatividade 


Logo, embora as duas partículas que colidem sejam idênticas, os cscalares cor- 
respondentes m ( va ) e m( vs) não são os mesmos para velocidades v, # vp. Entre- 
tanto, a grandeza 


] 
l 
| (6.87) 


onde mo é o valor próprio de m (v), obtido quando a partícula está em repouso. 

Mas, no limite de baixas velocidades, devemos obter a mecânica não-relativís- 
tica (newtoniana), em que m representa a massa da particula. Logo, m é a massa 
de repouso, e a expressão relativística do momento deve ser dada por 


(6.88) 


A característica da inércia da partícula que tem um significado invariante é a sua 
massa própria ma. 


6.10 Energ 


relativística 


A lei fundamental da dinâmica, na forma em que foi enunciada por Newton, é 
mantida na relatividade: 


F=] (6.89) 


mas, como vimos, nem todos os tipos de leis de forças são compatíveis com o 
princípio de relatividade. 
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Para uma partícula de carga q movendo-se com velocidade y num campo cle- 
tromagnético, permanece válida a expressão da força de Lorentz. 


F=9(E+vxB) (6.90) 


de modo que a (6.89) assume a mesma forma que na mecânica não-relativística, 
exceto pela definição do momento p. que é dado pela (6.88). 

O movimento de partículas carregadas em aceleradores, onde elas adquirem 
velocidades próximas de c , fornece testes experimentais abundantes das (6.88) a 
(6.90). confirmando-as com grande precisão. 

Em particular, isso se aplica à “variação da massa com a velocidade” (6.87). 

A taxa de variação temporal da energia cinética de uma partícula continua 
sendo dada por 


[ET gd 
[E -p.y-v é (6.91) 


| dt dt 


onde T representa a energia cinética. Pela (6.88). 


EE cão 
dt ki 
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ou seja 
dE 
= 6.92 
ra (6.92) 
onde 
Lg A 
| 3 e (6.93) 
| 
Resulta que da (6.92) que 
T = E + constante (6.94) 


Por definição, a energia cinética de uma partícula deve anular-se quando ela 
está em repouso (v = 0). Portanto, a constante de integração na (6.94) tem de valer 
(me), o que dá 


(6.95) 


: sa j 
YZ 4 termos de ordem e) (6.96) 
c 


mg? + (6.96) 


ou seja, desprezando correções de ordem superior. recuperamos a expressão não-re- 
lativística da energia cinética. 
As (6.93) e (6.95) dão: 


E=mcd+T (6.97) 


Conforme veremos abaixo, E representa a energia iotal da partícula, e a constante 
mc é a energia de repouso. 


Elevando ao quadrado ambos os membros da (6.88), obtemos 


ou seja 


(6.98) 


(6.99) 


Vemos pelas (6.88) e (6.93) que, para mo + 0 , tanto | pl como E crescem indefini- 
damente quando v — c. Logo. wna partícula de massa de repouso = O nunca pu- 
de atingir a velocidade da luz. 

Por outro lado, isso não fica excluído pelas (6.98) e (6.99) para mo = O; neste 
caso, temos: 


m=04]y 


=celp=É| (6.100) 


- 


ou seja, uma partícula com mo = O se move com velocidade c e a magnitude de seu 
momento é igual à sua energia total dividida por c. Não é apropriado falar de “mas- 


sa de repouso” nesse caso, porque uma tal. partícula não pode ser reduzida ao re- 
pouso (seria necessário um referencial com velocidade c). 

São conhecidas duas partículas com essas propriedades: o fóton e o neutrino 
(recentemente, surgiram dúvidas sobre se a massa dos neutrinos de fato é nula). 

No caso da radiação eletromagnética já se sabia desde Maxwell que cla trans- 
porta não só energia, mas também momento. Resulta das equações de Maxwell, 
fazendo o balanço local de momento, que a densidade de momento transportada é 
dada por 


(6.101) 


onde 8 é o vetor de Poynting, ou seja, a densidade de corrente de energia. No caso 
de uma onda plana, vimos |cf. (5.15)] que (no vácuo) 


S=euá=Ue| (6.102) 


onde U é a densidade de energia. Logo, a (6.101) fica 


(6.103) 


o que egúivale à (6.100), em termos de densidades. Por conseguinte, a teoria de 
Maxwell confirma a (6.100). 

Uma das manifestações do momento transportado por uma onda eletromag- 
nética é a pressão de radiação. Quando a radiação eletromagnética é refletida ou 
absorvida por uma superfície. ela sofre uma variação de momento, exercendo por- 
tanto uma força sobre essa superfície, que corresponde à pressão da radiação. 


È a pressão da radiação solar sobre as caudas dos cometas que as leva a apon- 


tar em direções que se afastam do sol (isto já havia sido conjecturado em 1619 por 
Kepler). Recentemente, a NASA fez testes com uma 


“vela espacial”, que usaria a 


pressão da radiação solar para propulsão de um veículo espacial. 


6 


1 A imércia da energia 
A inércia da energia foi descoberta por Einstein em 1905. No ano seguinte, ele 
mostrou que se poderia obter o resultado com o auxílio de um argumento 
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heurístico, que vamos reproduzir agora. Como é típico em muitas contribuições de 
Einstein, baseia-se numa “experiência imaginada”. 


Imaginemos que uma cavidade cilíndrica 
evacuada de comprimento L flutua no 
espaço (vácuo), tendo massa M. 

Nas extremidades da cavidade (fig. 6.13) 
estão colocados dois corpos A e B, cujas 


massas supomos desprezíveis em con- 
Fig. 643 Cavidade cilindrica fronto com M. 


Suponhamos agora que o corpo A transmita para B uma energia A E, sob a 
forma de radiação eletromagnética, e que essa energia seja totalmente absorvida 
por B. Admitimos que a duração dos processos de emissão e absorção (na região 
do visível, ~ 10? s) é desprezível em confronto com o tempo T = L/c que a ra- 
diação leva para atravessar o cilindro. 

Pela (6.100), a radiação transporta um momento AP = AE/c. A lei de con- 
servação do momento implica então que o centro de massa do cilindro adquire 
um momento — A P (recuo), no sentido B —> A. Logo, durante o intervalo de 
tempo T que a radiação leva para atravessar o cilindro, o CM (centro de massa) 
se desloca de 


AE Lo Lap (entidoB-A) (6103) 
M Mic ie Me 
Suponhamos agora que, após ter absorvido a radiação, o corpo B se desloca, 
sob o efeito unicamente de forças internas ao sistema, com velocidade vy, até atingir 
A. Seja m; a massa de B após a absorção da energia A E. Novamente pela conser- 
vação do momento total, o CM do cilindro adquire, durante o movimento de B, 
uma velocidade V = m v/M no sentido A — B, e se desloca de 


v.L =P Gentido A > B) (6.104) 
y 


durante o tempo L/v que B leva até atingir A. 
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latvidade 


Após atingir A, B transfere de volta para A a energia A E que havia recebido, 
ficando com massa mz , e volta para a outra extremidade do cilindro, produzindo, 
por analogia com a (6.104), um deslocamento do CM de 


=m, 
M 


L (sentido B > A) (6.105) 


Na situação final, a distribuição de energia é idêntica à inicial. O deslocamento 
resultante do CM do cilindro é, pelas (6.103) — (6.105), 


) (sentido A > R) (6.106) 
4 


Como no cilindro só agiram forças internas, e a configuração final é idêntica à 
inicial, não pode ter havido um deslocamento do CM. Logo, 


Ax=0 , edafsogueque |74 — m, (6.107) 


ou seja, esta é a variação de massa do corpo B devida à transferência da energia 
AE. 

Mas a energia pode ser armazenada por B sob qualquer forma (térmica, poten- 
cial, química, ...). Logo, qualguer forma de energia tem inércia, e a massa inercial 
m associada à energia E é dada pela célebre relação de Einstein 


(6.108) 


o que é um dos resultados mais importantes da teoria da relatividade restrita. 


Devido ao valor extremamente elevado do “fator de conversã 


c? , a variação 
de massa associada à variação de energia em processos macroscópicos usuais é 
demasiado pequena para ser detetada. Por exemplo, quando | mol de O 2 se com- 
bina com 2 mol de H 2 para formar 2 mol de água, a variação de massa associada 
ao calor de reação é ~ 107º da massa total, várias ordens de grandeza menor do 
que o limite da precisão na medida da massa. 


Entretanto, o próprio Einstein chamou a atenção já em 1905 para a possibili- 
dade de veri 


cação experimental em processos radioativos, em que a energia libe- 
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tada é muito maior. Com efeito, a relação de Einstein desempenha um papel extre- 
mamente importante em física nuclear, onde ela foi verificada com grande precisão. 
Caso exista um processo pelo qual massa de uma partícula possa ser converti- 


da em energia, a (6.108) também define a “taxa de conversão! 


. Depois da des- 
coberta do pósitron por Anderson (1932), foi verificado por Blackett e Occhialini 


que um raio y, passando próximo de um núcleo (cuja presença é necessária para 
que haja conservação do momento), pode criar um par elérron-pósitron. Para isso, 
é necessário que a energia do y seja superior ao dobro da energia associada à 
massa de repouso do elétron, ou seja, > 1,02MeV. Recentemente, observou-se tam- 
bém a criação direta de um par por colisão entre dois fótons. 

Reciprocamente, um par elétron-pósitron pode aniguilar-se em dois raios Y, 
convertendo toda a massa em energia de radiação. 


Na física pré-relativística, o princípio de conservação da energia e o princípio 


de conservação da massa eram considerados como independentes. A relação de 
Einstein unificou esses dois princípios. Entretanto, na maioria dos processos, a 
massa (determinada por pesagem, por exemplo) e a energia (medida pelo trabalho 
realizado) se conservam separadamente. A razão é que apenas uma pequena parte 
da energia total tem um papel ativo no processo: o restante, incluindo a massa de 
repouso, não toma parte no processo, permanecendo passivo. 

Essa subdivisão da energia em ativa e passiva depende do processo. Nas rea- 
ções químicas, só a energia de ligação dos elétrons das camadas externas dos áto- 
mos é ativa. Numa reação nuclear, a energia associada com as forças nucleares é 
ativa, mas aquela associada às massas de repouso das partículas constituintes do 
núcleo permanece passiva. 


A explicação do caráter p 


vo de uma parte da energia só pode ser dada 


analisando a dinâmica de cada processo: trata-se de um típico efeito quântico 


6.12 O espaço-tempo de Minkowski 


Vimos na Seç. 6.7 que o intervalo entre dois eventos é invariante por transfor- 
mação de Lorentz, tendo um sentido absoluto: é o mesmo em qualquer referencial 
inercial. Se, num dado referencial, os dois eventos se caracterizam por coordenadas 
(m,h)e (x2,%), o quadrado do intervalo entre eles é dado pelas (6.48) e (6.50) 


(6.109) 


die lafa- ea- ea” 
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Az=m-x , At=(b-n)| 


O matemático Hermann Minkowski (que havia sido professor de Einstein em Zü- 
rich) observou que, introduzindo formalmente uma coordenada imaginária em lugar 


da coordenada temporal, com x = (x,,X».%3).e xo = ct, obtém-se 


| x = ya - Bx) 
TL especial "AT PE 
| % = t -Pa) 


(6.110) 


ix | 


e a (6.109) se escreve 


(6.111) 


[AJ =(05) +80) tanan] 
que é idêntica à expressão do quadrado da distância entre dois pontos num espaço- 
tempo quadridimensional, onde as coordenadas de um evento seriam 
(1. X2,%3,%4), conforme a geometria euclidiana. 


Como a contribuição do termo temporal na (6.111) é porém negativa, 
—( Axo), diz-se que o espaço-tempo tem métrica pseudo-euclideana. 
Em particular, se Ax, = Ax = 0, resulta 


(6.112) 
GF =) (1) 


Essa expressão é invariante para uma rotação de coordenadas (fig. 6.14) no plano 


x (xr): 
xX, 
"i (6.113) 
Ko . xi = x, cos Ọ + x, senq 
b a 
xX, =x Sen Ọ + x4 cosq 


Fig. 6.14 TL como rotação 


Como x;” deve permanecer real e x imaginário puro. é preciso que cosy seja 
real e sen Ọ imaginário. Pelas (5.86) e (5.90), basta tomar 


cos q = chy 
ọ=iy (6.114) 


[sen ọ =ishy 


o que dá 


chy — xy sh Y 


(6.115) 
xo = shy + x chy 


m E E É dog a V E 
Se identificarmos a origem O (x = 0) com xı = Vi = OE B xo, isto dá 


> = 7. sy =YB (6.116) 


e as (6.115) se reduzem às equações (6.30) da TL especial. Logo, a TL especial 
pode ser interpretada geometricamente como uma rotação por um ângulo imagi- 
nário no plano (x ,x4) do espaço-tempo. 

Minkowski escreveu: “Daqui por diante, o espaço, como entidade separada, e 
o tempo, como entidade separada, estão fadados a se dissiparem em meras som- 
bras, c somente uma espécie de união dos dois preservará uma realidade indepen- 
dente”. Entretanto, é importante notar que a coordenada temporal preserva um ca- 
ráter diferente das coordenadas espaciais, o que se manifesta pelo sinal (—) no 
quarto termo — (Axo) da (6.111) ou, equivalentemente. pela unidade imaginária 
na (6.110). 

A principal vantagem da interpretação geométrica de Minkowski é metodo- 
lógica: ela permite escrever expressões de leis físicas de forma a garantir automati- 
camente que elas sejam preservadas pela transforme 
façam automaticamente o princípio de relatividade. 


de Lorentz, ou seja, satis- 


Basta para isso introduzir um formalismo de vetores no espaço-tempo. Como 
efeito. sabemos que, no espaço tridimensional, uma lei física expressa em termos 
de vetores (como F = d p/dt) é automaticamente satisfeita num sistema de coor- 
denadas obtido por uma rotação de eixos, porque os dois membros se transformem 
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da mesma mancira (são covariantes). Podemos definir um vetor dizendo que a lei 
de transformação das suas componentes numa rotação de eixos é a mesma que a 
das coordenadas (x , X , x3 )- 

Essa definição se estende à de um guadrivetor no espaço-tempo de Minkows- 
ki: suas 4 componentes se transformam numa rotação de eixos (em'particular, numa 
TL) da mesma forma que as coordenadas (x,.x, 
quadrivetor é também imaginária pura. 


2.34). A 4º componente do 


Exemplo 


a =) cem PAASA 


dy = (dzd, dxs,dx,) é um 4-vetor 


(ca (car) - (dx) 


é um invariante. O mesmo vale para 


(6.117) 


que é o intervalo infinitesimal de tempo próprio no movimento de uma partícula. 
Logo, 


(6.118) 


onde mo é um invariante, é também um 4-vetor. 


A parte espacial de pa é 


[dx my 

mo 

| 
| 
| 
L 


dt 


(6.119) 


relativo 
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que é o momento relativístico (6.88). 
A parte temporal de pa é 


(6.120) 


onde E é a energia relativística (6.93). 


O quadrivetor pa = (p,í E/c) chama-se quadrimomento da partícula, e as 
leis de conservação do momento e da energia se unificam na conservação do 


quadrimomenio. Da mesma forma que 


(6.121) 


também deve ser um invariante. Com efeito, pela (6.98), esse invariante é 
(-mo?c?), onde mo é a massa de repouso da partícula. 

As equações de Maxwell podem ser escritas em forma explicitamente covari- 
ante, demonstrando que satisfazem o princípio da relatividade. Para isto, introduz- 
se um quadritensor de 2.º ordem, Fap gue se chama o tensor campo eletromag- 
nético, pois suas componentes contêm tanto E como B. Numa TL, essas componen- 
tes se misturam, mostrando que a separação em E e B não tem sentido absoluto: 
depende do referencial; o que tem sentido é o campo eletromagnético. Dessa forma 


resolve-se a aparente assimetria na lei de Faraday comentada por Einstein na intro- 
dução de seu trabalho de 1905 (Fís.Bás. 3, Seç. 9.1). 


6.13 Noções sobre relatividade geral 


Vimos na Seç. 6. 7 que nenhum sinal pode propagar-se com velocidade > c . 
A interação eletromagnética, descrita pelas equações de Mawell, satisfaz esta con- 
dição. Entretanto, cla não é satisfeita pela descrição newtoniana de outra interação 
fundamental existente na natureza: a gravitação. 
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Com efeito, pela lei de Newton da gravitação, ela é descrita como uma in- 
teração instantânea à dislância: se mudarmos a pos 
instantaneamente as forças gravitacionais entre ela e quaisquer outras mass 
mais distantes que estejam. 


o de uma massa, mudam 
por 


Einstein propô: 


se a reformular a teoria da gravitação de forma a torná-la 
compatível com as limitações impostas pela relatividade restrita. Uma das princi- 
pais pistas que encontrou para auxiliá-lo nessa tarefa foi um fato que já havia des- 


pertado a atenção de Newton, m 
igualdade da massa inercial e da massa gravitacional. Já vimos (Fis, Bás. 1, Seç. 
13.7) como ela o conduziu a formular o Princípio de Equivalência: 


s que jamais havia encontrado explicações: a 


(4) O Princípio de Equivalência 


Como vimo: 
cional m; que o campo gravitacional numa pequena região próximo à superfície da 
Terra produz a mesma aceleração (— g) de queda livre em qualquer corpo material 


é devido à igualdade entre massa inercial m; e massa gravita- 


(“experiência” de Galileu da Torre de Pisa). Com efeito, a 2.º lei de Newton dá 
mk=-m,g (eixo vertical para cima) (6.122) 


onde, no 1.º membro, temos a massa inercial, e no 2.º a massa gravitacional (res- 
posta de um corpo de prova ao campo gravitacional). Como m; 


ms, resulta que 


-78 


Logo, a força gravit: 
massa inercial de uma partícula (corpo de prova) sobre a qual atua. Vimos no 
curso de Mecânica, (Fís. Bás. 1, Cap. 13) que essa propriedade é sempre válida 
para forças de inércia, cterísticas de referenciais não-inerciais. Isso sugere que 
possa existir uma relação entre gravidade e forças de inércia, e que convenha exa- 


ional tem a notável propriedade de ser proporcional à 


ar 


minar referenciais não-inerciais. Na relatividade especial, o contínuo espaço-tempo 
tem caráter absoluto (atua sobre a matéria, mas a matéria não atua sobre ele). Por 
outro lado, referenciais inerciais concretos são definidos relativamente à dis- 
tribuição de matéria no Universo (Princípio de Mach). 

Num referencial inercial (S) próximo à superfície da Terra, e numa região 
suficientemente pequena para que o campo gravitacional possa ser tratado como 
uniforme, a 2.º lei de Newton se es 


reve, para uma partícula de massa m, 
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(6.123) 


onde Hj representa forças não-gravitacionais que atuem sobre a partícula. 

Se considerarmos agora um referencial ( §') que se desloca em relação a (S) 
com movimento retilíneo uniformemente acelerado de aceleração A, vimos (Fís. 
Bás. 1, Seg. 13.2) que a aceleração da partícula em relação a (S^) é, como con- 


segiiência da lei de Galileu de composição de velocidades, 


(6.124) 

de modo que a (6.123) fica 
m +A)=-mg+F, (6.125) 

e, em particular, se À = —g 
mY =F, (6.126) 


ou seja, num referencial em queda livre no campo gravitacional (A = —g, “ele- 


vador de Einstein”), desaparecem os efeitos do campo gravitacional sobre a par- 
tícula. É o efeito da “ausência de peso” dos astronautas em órbita. A (6.126) mos- 
tra que (S^) se comporta como se fosse um referencial inercial na ausência de 
campo gravitacional. 

Por conseguinte as leis da mecânica na presença de um campo gravitacional 
—g uniforme são as mesmas que resultariam, na ausência do campo, num referen- 
cial uniformemente acelerado, com aceleração — g: não é possível distinguir entre 
as duas situações por experiências de mecânica, o que generaliza o princípio de 
relatividade de Galileu. 

Em 1908, Einstein estendeu essa conclusão a todas as leis físicas, formulando 
o Princípio de Equivalência: Num recinto suficientemente pequeno para que o 
campo gravitacional deniro dele possa ser tomado como uniforme, em queda livre 
dentro desse campo, todas as leis físicas são as mesmas que num referencial iner- 


cial, na ausência do campo gravitacional. 


Por que a restrição a um “recinto sufici- 
entemente pequeno”? Porque, para o 
campo gravitacional da Terra, por exem- 
plo, se tomarmos um recinto de dimen- 
sões comparáveis às da Terra (ABCD, na 
fig. 6.15). o campo gravitacional não será 


mais uniforme nessa escala, e é perfeita- 
mente possível detetá-lo. As trajetórias 
E Pi % Ea de dois pontos materiais bem separados, 

como P; e P> na fig. 6.15, tenderão a a- 

è proximar-se uma da outra. Analogamen- 

Fig. 6.15 Campo gravitacional da Terra te, para dois pontos a distâncias bastante 
diferentes do centro da Terra, como P; e 

Ps, as acelerações serão sensivelmente diferentes. Logo, usando como “corpo de 


prova” um par de partículas suficientemente afastadas cntre si, é possível neste 


caso detetar a existência do campo gravitacional, e não é possível eliminá-lo por 
uma mudança para um referencial uniformemente acelerado. 

Vemos assim que o Princípio de Equivalência tem de ser aplicado local- 
mente, em pequenos recintos, que podemos chamar de referenciais localmente 
inerciais. 

Tomando essa precaução. porém, o Princípio de Equivalência nos permite 
inferir a existência de alguns dos efeitos novos característicos da relatividade 
geral, 


Assim, já vimos [Fís. Bás. 
de uma deflex 
deflexão pelo campo gravitacional do Sol foi confirmado pelas observações reali- 
zadas em Sobral (Ceará) durante o eclipse solar de 1919, que tiveram grande reper- 


- Seg. 13.7(b)] que ele permite prever a existência 


ão gravitacional da luz. O resultado previsto por Einstein para a 


(b) O desvio para o vermelho 


Consideremos um pequeno recinto em queda livre no campo gravitacional na 
vizinhança da superfície da Terra, com aceleração — g. No instante = 0 em que 
se inicia a queda a partir do repouso, é emitido um raio de luz monocromático de 
fregiiência vo por uma fonte F no chão do recinto, verticalmente em direção ao teto, 
que se encontra a uma altura k do chão (fig. 6.16), e é suposto transparente. 


Pelo Princípio de Equivalência, a luz che- 
ga ao teto no instante / = h/c, e sua fre- 
giiência. medida no referencial (S) do 
recinto em queda livre, continua sendo vo. 
Para um observador externo, no re- 
ferencial ( S) em que atua o campo gravi- 
tacional g, qual é a frequência da luz de- 
tetada, no instante em que ela chega ao 
ponto P, na altura do teto (fig. 6.16)? 


Nesse instante, a fonte de luz está-se 
afastando do observador em (S) com ve- 
locidade V = gi. Lugo. a fieqlência da 
luz medida em ( S) terá sofrido um efeito 

Fig. 6.16 Recinto em queda livre Doppler. dado pela (6.70) com 8 = 0: 


v=w(L-B)= v ( a e) (6.127) 
c 
ou, como 1 = h/c, 


(6.128) 


onde, pelas condições impostas, é B << 1 , de modo que tomamos 
a 
o vermelho. O “desvio percentual” AV/Vo é dado pela diferença de potencial gra- 
vitacional gh entre o teto e o chão, dividida pelo quadrado da velocidade da luz. 


. Como Av = y — vo < 0, vemos que este é um desvio para 


Se. em lugar de estar “subindo” no campo gravitacional, a luz estivesse “des- 
cendo” do teto para o chão, a fonte estaria-se aproximando de um observador em 
(S) ao nível do chão, e o desvio seria para o àzul; correspondentemente, a diferen- 
ça de energia potencial gravitacional (gh) seria negativa. 

O desvio gravitacional foi medido em 1960 por R. V. Pound e G. A. Rebka 
com raios y de 14,4 keV, caindo de uma altura de 22.6 m num tubo onde 


se havia feito vácuo, o que dá —gh/e? « —2,46x 107º ; a experiência deu 
(= 2.57 + 0.26) x 107“ (precisão de 10%), e foi refinada depois por Pound e Sny- 
der (1964, 65), verificando o resultado com precisão de 1%. O elevado grau de 
precisão foi possível empregando uma técnica de ressonância (efeito Môssbauer) 
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Entretanto, uma verificação ainda mais precisa foi feita em 1976 por R. Vessot 
e M. Levine, que compararam a fregiência de um relógio atômico (maser de hidro- 
gênio) colocado num foguete, que subiu a uma altitude de 10.000 km, com um 
relógio idêntico no solo. O efeito foi verificado com precisão de 7 x 107. 

Como o potencial gravitacional (energia potencial por unidade de massa) é, 
para o campo -g , 


o(z)=gz (6.129) 


(campo - g=— V q), a (6.128) se escreve 


(6.130) 


onde os pontos F e P estão indicados na fig. 6.16. 


Apliquemos esses resultados ao potencial gravitacional newtoniano de um cor- 
po de massa M, dado por (Fís. Bás. 1, Seç. 10.9) 


GM 


(6.131) 


onde G é a constante gravitacional e tomamos o nível O de energia potencial no 
infinito (q. = 0). Notando que a unidade de tempo é definida em termos do pe- 
ríodo Ar = 1/v da luz emitida por um átomo, a (6.130) mostra então que a relação 
entre iutervalus de tempo medidos pur um relógio à distância r do corpo e um 
relógio idêntico no infinito será 


pa NA (1 = en) = aedi + Es | (6.132) 


ou seja, o campo gravitacional afeta a marcha de um relógio: o relógio, no campo 
gravitacional, “anda mais devagar”, de modo que luz emitida na sua vizinhança 


chega avermelhada ao “infinito”, onde não há campo gravitacional. 
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O “paradoxo das gêmeas” 


Ana e Bia, também conhecidas como “A” e “B”, são gêmeas. Enquanto A 
permanece na Terra. B viaja num foguete a uma estrela situada a 15 anos-luz da 
Terra, a uma velocidade V tal que V/c=B=3/5 :o fator de dilatação tempo- 
tal éy = (1 -— B?) = 5/4. Chegando à estrela, B volta para a Terra à mesma 
velocidade (B = — 3/5). 

Para A, a viagem de B durou 2 x 
x 50 = 40 anos. 

Por outro lado, para Bia, é Ana que se deslocou em relação a ela com 


= 50 anos, ao passo que para B durou 


apenas 


B=+3/5.eB pode afirmar que a dilatação temporal ocorreu para A, de modo 
que, segundo B, devem ter decorrido apenas 4/5 x 40 = 32 anos para A. 

Quem tem razão? Ana é 10 anos mais velha ou 8 anos mais moça do que Bia, 
quando esta retorna? 

Admitindo que o referencial de Ana (a Terra) seja inercial, é Ana quem tem 
razão. O referencial de Bia (o foguete) não é inercial, porque tem de ir e voltar: o 
foguete precisa desacelerar chegando à estrela e acelerar de novo para voltar à 
Terra; estas acelerações são muito grandes, porque têm de ier como efeito a pas- 
sagem de B para B =-2. No referencial acelerado do foguete, como num 


campo gravitacional, o tempo passa mais devagar, e é por isto que Bia está mais 
moça do que Ana, ao voltar. 


Uma comprovação experimental desse efeito foi obtida em 1971 por J. C. He- 
fele e R. E. Keating. Eles viajaram em torno da Terra em aviões a jato comerciais, 
tanto dirigindo-se para leste como para oeste, e transportando a bordo relógios atô- 
micos de césio, cujas leituras após a volta ao mundo foram comparadas com as de 
relógios idênticos que haviam permanecido no Observatório Naval em Washington. 


As diferenças entre viagens para leste e para oeste resultam da rotação da Terra, 
que introduz outras forças inerciais (centrífuga, Coriolis). A tabela abaixo compara 
as previsões teóricas da relatividade geral com as diferenças de tempo A 1 (em na- 
nossegundos) observadas. 


At = ta — tA (emi0?s) 


f | 
| semidoda a (e i 
Es a 

E O Experimental Teórico | 
| = | 
| Para oeste 27347 215421 | 
| | 


| Para leste -59 +10 -40 +23 


Não é um método muito prático de retardar o envelhecimento! 


(c) A curvatura do espaço-tempo 


Pelo que vimos na (6.132), um intervalo de tempo infinitésimo dt num ponto 
x. na presença de um campo gravitacional com potencial q (x). está relacionado 
com o intervalo de tempo d t- correspondente no referencial localmente inercial em 


queda livre em x, no qual o campo gravitacional está ausente, por 


| 
(dr()= de 1+ (6.133) 


A energia potencial de uma massa m no campo. dada por mp (x), é geral- 
mente (excluindo campos gravitacionais muito intensos) uma fração muito pequena 
da energia total mc? , de forma que 


(6.134) 


o que dá 


UY = (01) l + 2] (6.135) 


ë 


No recinto localmente inercial em queda livre, o quadrado de um intervalo 


mo de espaço-tempo, que define a métrica do espaço-tempo, é dado pela 


(6.109): 


i 
K s = (ax +(dy) + (do) -e (do) | (6.136) 

que é a métrica de Minkowski da relatividade especial. 
Entretanto, num referencial onde existe um campo gravitacional, temos de sub- 


stituir (dt) pela (6.135), o que dá 


(6.137) 


ou seja, a presença de um campo gravitacional modifica a métrica (geometria) do 
espaço-tempo. 


D 


Em geral, essa modificação não se restringe à componente temporal. Para ver 
que afeta também a parte espacial, basta considerar um exemplo. 


a p Consideremos um disco de raio r em ro- 
tação, com velocidade angular w (fig. 
a A a 6.17), em tomo de um eixo |L ao plano 
da figura. Supomos Qr << c , mas ainda 
| lo assim suficientemente grande para que efei- 
| tos relativísticos não sejam desprezíveis. 
Imaginemos que se meça o raio do disco 
alinhando ao longo de OP “réguas” de 
Ba aa uma unidade de comprimento em contato 
entre si; o resultado são r réguas. Se fi- 
Fig. 6.17 Plataforma girante zermos o mesmo ao longo da circunferên- 
cia do disco, e o resultado são C réguas, 
sabemos que, com o disco em repouso num referencial inercial,” 


€ =27 (6.138) 
F 

Entretanto, quando o disco está em rotação com velocidade angular œ, o com- 
primento das réguas ao longo do raio, transportadas numa direção L à velocidade, 
não muda (r não se altera), mas as que estão alinhadas ao longo da periferia (trans- 
portadas na direção da velocidade) sofrem contração de Lorentz. Logo, é preciso 
alinhar um número C’ > C de unidades para cobrir toda a periferia, o que implica 


(6.139) 


Logo, num disco em rotação, deixa de valer a geometria cuclideana. Por outro 
lado, de acordo com o Princípio de Equivalência, no referencial (S) do disco, to- 
mado como referencial de repouso, existe um 
força 
afetar a geometria (tanto espacial quanto temporal) do espaço-tempo. 


mpo gravitacional” (campo das 


s centrífugas e de Coriolis). Logo, a presença de um campo gravitacional deve 


O ES ED 


* Podemos imaginar a régua suficientemente pequena para aproximar 27 Lanto quanto quisermos. 


232 


A geometria toma-se não-euclideana (geometria “física”). Isso corresponde a 
ter curvatura no espaço-tempo. Para ilustrar o conceito de curvatura, é conveniente 
considerar um espaço bidimensional, ou seja, uma superfície. 

Um plano não tem curvatura: o mesmo se aplica a um cilindro, que pode ser 
“desenrolado” sobre um plano: a curvatura é uma propriedade intrínseca da super- 
ficie, detetável em pequenas regiões. não afetada pelo “desenrolamento”, desde que 
não haja dilatação ou dobra. 


Já a superfície de uma esfera tem curva- 
tura. Numa esfera de raio R, o “paralelo” 
T da fig. 6.18 é um círculo, por ser o lu- 
gar geométrico dos pontos “equidistan- 
tes” do polo norte N, onde a distância 
tem de ser medida ao longo de uma geo- 
désica, que é o caminho mais curto (ou 
estacionário com respeito a pequenas va- 
riações) cntre 2 pontos sobre a superfície. 
Assim, O raio r do círculo F é (fig. 6.18) 


Fig. 6.18 Curvaiura da esfera 


r=R6 (6.140) 


ao passo que sua circunferência é 


C=2nx0P=2nR sen ð (6.141) 


Logo, 


(6.142) 


o que é característico de uma superfície de curvatura positiva. A soma dos ângulos 
internos de um triângulo esférico é também maior que 180º (fig. 6.18, AN AB). 
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Um exemplo de superfície com curvatura 
negativa é uma sela (fig. 6.19). 

Nesse caso, para um círculo T, tem-se 
C/r >27 , c a somados ângulos inter- 
nos de um A , como ABC, é < 180. 

É importante novamente observar, como 
foi salientado por Gauss, que a curvatura 
de uma superfície é uma propriedade intrínseca, que pode ser determinada a partir 
de medidas feitas sobre a superfície (sem sair dela). 


Fig. 6.19 Sela 


Assim, por exemplo, as (6.140) e (6.142) dão, para r << R , ou seja, para 
círculos pequenos sobre a esfera, 


E 
1 + 
2nr 8 3 


(6.143) 


(6.144) 


onde o 2.° membro pode ser determinado sem sair da superfície. 


Para um campo gravitacional, a curvatura pode ser positiva ou negativa, e cu 
geral varia de ponto a ponto: é uma curvatura do espaço-tempo quadridimensional. 
Conforme foi mostrado por Gauss e Riemann, a curvatura pode ser obtida através 
da métrica g ap, onde 


i x 
UJ =F È gap stx Axa da (6.145) 
ani pet 


e estamos usando a notação quadridimensional da Seç. 6.12. A definição da geo- 
metria através da métrica é característica da geometria riemanniana. 
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Os efeitos gravitacionais estão contidos na forma pela qual a métrica ap varia 
com (x; 
curvatura. As equações de Einstein da relatividade geral relacionam essa curvatura 
com a presença de matéria (equivalente a energia). que produz o campo gravi- 


3.44), OU Seja, na geometria do espaço-tempo. especialmente na sua 


tacional. 

Na ausência de curvatura, tem-se a métrica (6.136) de Minkowski. A lei da 
inércia diz nesse caso que uma partícula livre se move com movimento retilíneo 
uniforme. 


Sua linha de universo (trajetória quadridi- 
mensional) é portanto uma reta, (fi 


5.20) que é uma geodésica no espaço- 


satisfazendo a 


tempo de Minkowski 


öf, ds=0 (6.146) 


ou seja, o “caminho” (intervalo) entre os 
Fig. 6.20 Linha de universo de uma partícula livre pontos 1 e 2 da linha de universo de uma 
partícula livre é estacionário (compare com o Princípio de Fermat). 

A lei de movimento básica na relatividade geral é uma extensão ao espaço- 
tempo curvo: postula-se que a linha de universo de uma partícula no espaço-tempo 
é uma geodésica. 

Uma analogia com essa descrição, para o movimento sobre uma superfície 
curva (espaço bidimensional) seria imaginar esse espaço como, por exemplo, a su- 
perfícic de um sofá. Sc colocarmos uma bolinha de chumbo sobre o sofá, ela pro- 
duzirá uma depressão, imprimindo uma curvatura à superfície, que seria o análogo 
do “campo gravitacional” da bolinha. 


Se agora colocarmos outra partícula (bolinha) sobre esta superfície deformada, 
ela se moverá sobre uma trajetória que é “guiada” pela curvatura, representando o 


análogo da geodésica no espaço-tempo. É importante observar que, no caso gravi- 


tacional, a curvatura afeta tanto o espaço como o tempo. conforme veremos agora. 


(d) A solução de Schwarzschild 


O problema mais simples seria o do campo gravitacional central de uma partí- 
cula de massa M em repouso (no movimento planetário. seria o Sol). É natural, 
nesse caso. tomar origem na partícula e adotar coordenadas esféricas (1,8. 9). 


A grande distância da partícula (r — œ), esperamos que o campo gravita- 
cional tenda a zero e que a métrica do espaço-tempo seja portanto a de Minkowski, 


(as = (ar) +(rdo), +(rsengao) - (e d (6.147) 


A presença de M deve alterar a métrica a distância finita, introduzindo cur- 
vatura no espaço-tempo. Como o problema é 
devem ser independentes do tempo, e. pela simetria es. 


de 68 e q. Pela mesma razão, a métrica nessas variáveis angulares não deve ser 


estático, os coeficientes da métrica 


a, não devem depender 


alterada. Assim, esperamos que a métrica seja da forma 
(ds) =a(r)(dr) + (dO) + (senodo) -bGYc dr) (6148) 


onde a(r) e b(7) são funções a determinar, resolvendo as equações de Einstein para 
o campo gravitacional da teoria da relatividade geral. 

Um argumento de plausibilidade para b(7) resulta da (6.135). O caráter está- 
tico da métrica implica que a sincronização dos relógios em posições diferentes 
(através de sinais luminosos) não deve variar com o tempo. Entretanto, pelas 
(6.132) e (6.135), a presença do campo gravitacional afeta a marcha dos relógios 
diferentemente conformc a posição. Para manter a sincronia e o caráter estático do 
espaço-tempo, é preciso portanto corrigir o coeficiente de (cdr p por um fator que 
compense a (6.135), o que daria 


GM 
bẸr)=1-2 
O Ee (6.149) 


Em 1916, Schwarzschild obteve uma solução exata das equações de Einstein 
da relatividade geral que tem essa forma. O resultado para a(r) é o inverso de b(r), 
como na relação entre dilatação de Lorentz temporal e coniração espacial, o que dá 
a solução de Schwarzschild: 


- [eo + Genoao)]-[1-E Je a, 6150) 


onde 
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(6.151) 


2 
É 


chama-se o raio de Schwarzschild associado à massa M. Para r > œ, a (6.150) 


tende à (6.147). 


Sc interpretarmos M como a massa do 
Sol, a linha de universo de um planeta 
seria uma geodésica no espaço-tempo 
com a métrica de Schwarzschild (fig. 
6.21). 

O cálculo mostra que a órbita não é mais 
a elipse newtoniana. 

Ela não é fechada: é em geral uma rosá- 
cea (fig. 6.22), correspondendo a uma 
precessão do periélio. 


Fig. 6.21 Linha de universo de um planeta 
em torno do Sol 


Fig. 6.22 Precessão do periélio 


Na mecânica newtoniana, ocorre uma precessão quando levamos em conta a 
presença dos demais planetas, como uma perturbação do problema de dois corpos. 
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Entretanto, havia uma pequena discrepância entre a precessão calculada pela me- 
cânica newtoniana e a precessão observada. 

O valor dessa discrepância para o planeta Mercúrio é de 43,11" + 0,45" (se- 
gundos de arco) por século. A relatividade geral, calculando as órbitas como geo- 
désicas na métrica de Schwarzschild, prediz para este desvio o valor 43,03" por 
século, em excelente acordo com a experiência. 

Também se pode empregar a métrica de Schwarzschild para obter a trajetória 


de um raio luminoso no campo gravitacional da massa M. Isso dá o valor numérico 
da deflexão gravitacional da luz. Para luz que passa próxima do Sol, encontra-se 
uma deflexão AQ = 1,75”. 

Para medir essa deflexão, é preciso comparar a posição aparente de uma es- 
trela no céu noturno com sua posição quando vista no céu, próxima do Sol, o que 
só pode ser feito durante um eclipse solar. O valor médio observado é de 1,89", 
mas os erros de observação são grandes. 

Por outro lado, o quasar 3C279, fonte intensa de ondas de rádio, é ocultado 
pelo Sol uma vez por ano, permitindo que se meça a deflexão gravitacional com 
precisão bem maior. O resultado é 1,73" + 0,05", em excelente acordo com a pre- 
dição da relatividade geral. 


(e) Buracos negros 


O coeficiente de (dr na métrica de Schwarzschild (6.150) tem uma singu- 
laridade (— =~) para r = rs (raio de Schwarzschild). Para M = 2 x 10kg (mas- 
sa do Sol, com G = 6,67 x 107! N - m?/(kg? e c=3x 10" m/s, acha-se 
rs = 3 km. Muito antes de atingir essa distância, o campo gravitacional do Sol já 
não seria assimilável ao de uma “massa puntiforme”. 


Em 1939, J. R. Oppenheimer e H. Snyder estudaram o que acontece na evo- 
lução de uma estrela quando ela atinge a etapa final, em que todo o combustível 
nuclear já foi exaurido. Não há mais como produzir o calor e a pressão necessária 
para contrabalançar a atração gravitacional 

Para um objeto de massa maior que o triplo da massa do Sol, resulta então que 
ele entra em colapso gravitacional: seu raio vai diminuindo até atingir rs, c tornar- 
se < rs. Que acontece para r < rs? 


Futuro 


É fácil verificar que nenhuma partícula pode estar em repouso para r < rs. 
Com efeito. a linha de universo de uma partícula só pode ser formada de intervalos 
do gênero tempo situados dentro do seu cone de luz em cada ponto (Seç. 6.7). Ora, 


se existisse uma partícula em repouso, seria dr = d6 = dọ = 0 ao longo de sua 


linha de universo, o que daria, pela (6.150), 


o que é impossível. 

Logo, qualquer partícula com r < rs continua colapsando para o centro: 
forma-se um buraco negro, assim chamado porque a própria luz é capturada pela 
atração gravitacional intensa, não podendo” emergir da região interna. O que acon- 
tece com o cone de luz ao penctrar dentro de um buraco negro está ilustrado na fig. 
6.23. Na região externa r> rs , porém, o campo gravitacional do buraco negro 
continua atuando. 

Existe evidência de que a fonte binária de raios X Cygnus X1 possa conter um 
buraco negro: a emissão de raios X estaria associada à energia liberada pela cap- 
tura de uma estrela “companheira” pelo buraco negro, de massa da ordem de 14 
massas solares. Também há evidência sugerindo a existência de buracos negros no 


núcleo de galáxias (em particular, a galáxia M87), incluindo, possivelmente, a nossa. 


(© Cosmologia 


Na escala cósmica de galáxias, a gravidade é a força dominante. Já em 1917, 
Einstein aplicou a relatividade geral para modelar o comportamento do universo 
como um todo. Naquela época, sequer estava estabelecida a existência de galáxias 
diferentes da nossa. Também se desconhecia a expansão do universo, de forma que 
o modelo inicial de Einstein era estático. 


O modelo para o universo é o de um “fluido de galáxi 
associadas a estrelas são — 1 A.L. (Ano Luz), para galáxias 
aglomerados de galáxias s 


As distâncias típicas 
ão ~10f AL. e para 
o ~3 X 107 A.L . Na maior dessas escalas (mas não 


nas outras!), as observações astronômicas indicam que o “fluido de galáxias” 


Quanticamente, isto deixa de valer, conforme foi mostrado por Stephen Hawking. 


parece ser homogêneo e isotrópico. Isso é postulado no modelo (“princípio cos- 
mológico”), de forma que ele descreve essa situação extremamente simplificada e 
só se aplica nessa escala dos aglomerados de galáxias. 

Resulta desse princípio que a curvatura K(1) do espaço tridimensional é 
constante para um dado tempo iż, mas varia com f. O primeiro modelo cosmológico 
dependente do tempo foi proposto por Alexander Friedmann em 1922 (depois foi 
generalizado), e era consistente com a expansão do universo observada posterior- 
mente por Hubble (Seç. 6.8). 


A curvatura K(f) é dada por 


K()- 


R (f) = fator de escala cósmico 


r (6) 


onde k = +1, 0 ou — 1. 

Há várias possibilidades. Se a curvatura do espaço é positiva, resulta que o 
universo é espacialmente finito, embora ilimitado, da mesma forma que, em duas 
dimensões, a superfície de uma esfera é finita mas ilimitada (sem fronteiras). Se a 
curvatura é nula ou negativa, o universo é infinito espacialmente. 

Em qualquer dos três casos, a escala de distâncias entre galáxias (mas não o 
tamanho delas) evolui com o tempo, correspondendo à expansão do universo”. A 
taxa de expansão é dada pela lei de Hubble (6.77): H = R (DIRCE). 

Isso significa que, no passado, as distâncias eram menores. Extrapolando para 
o passado remoto, chega-se a uma singularidade num "instante inicial", que corres- 
ponderia a uma "grande explosão" ("big bang"); a "idade do universo", pelas deter- 
minações do satélite WMAP (Seç. 6.8), seria de 13,7 (+0,2) bilhões de anos. 

A hipótese do "big bang" foi consideravelmente reforçada pela descoberta feita 
em 1965 por A. Penzias e R. Wilson (que lhes valeu o Prêmio Nobel de 1978) da 
radiação de fundo primordial. Trata-se de radiação ténuiva de temperatura = 2,7 
K remanescente do "big bang" e “resfriada" pela expansão (atualmente é dominada 
por microondas). Resultados recentes da missão espacial COBE ("Cosmic Back- 
ground Explorer") confirmam o caráter extremamente isotrópica dessa radiação, 
com flutuações muito pequenas, que poderiam nuclear galáxias. 


* Uma analogia bidimensional seria com a superfície de uma balão de borracha sarapintado que incha quando 
é soprado: cada pinta vê todas as outras afastando-se dela. 


PROBLEMAS 


1. Um sinal luminoso que, partindo de 
um ponto O’ de um referencial ( S”), se 
reflete num espelho à distância y’ de 
O” e volta para O”, pode ser considera- 
do como um “relógio” que marca inter- 
valos de tempo À 7“ correspondentes à ida 
e volta do sinal (fig.). Suponha que 
( S”) se desloca em relação a (S) com ve- 


locidade V na direção x” e calcule o intervalo de tempo correspondente A 7 em (S), 
admitindo o princípio da constância da velocidade da luz. Mostre que o resultado 
equivale à dilatação dos intervalos de tempo da relatividade restrita. 


(8) 2. Considere agora a situação (fig) em 
E — a k =A ri 
E v que O ralo luminoso se reflete entre O” c 
x— um espelho à distância x’ em (S'), na 
f direção da velocidade V. Calcule o tempo 
o <— 


necessário para esse percurso de ida e 
volta no referencial ($), levando em conta 
a dilatação dos intervalos de tempo obtida no Probl. 1. Mostre que isso permite 
obter a contração de Lorentz (Observação: os trajetos dos Probls. 1 e 2 cor-respon- 
dem aos dois braços do interferômeiro de Michelson). 


3. Demonstre que duas TL especiais sucessivas na mesma direção, com pa- 
râmetros B, = Vi/ce B = 
B correspondente. Relacione o resultado com a lei relativística de composição de 
velocidades. 


/e, equivalem a uma TL única, e calcule o parâmetro 


4. Demonstre a (6.47). 


5. Partindo da invariância da fase de uma onda plana monocromática (Seç. 
6.8), obtenha as expressões relativísticas do efeito de aberração, demonstrando que 
as direções 0/e 9 de propagação da luz em (S') e (S) estão relacionadas por 


sen 6 


i e p B cos8) | 
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6. (a) Escreva as egs. da TL especial em termos das coordenadas 
x =X,4%=y,x4=27,x% = cr Note que elas adquirem uma forma mais simétri- 
ca. (b) Usando a notação da parte (a), mostre que a equação de ondas 


é invariante por uma TL especial, mas não é invariante por uma transformação de 
Galileu. 


7. O comprimento / de uma régua num reterencial (5) em relação ao qual ela 
se move com velocidade V constante na direção x também pode ser definido por: 
l= V(At), onde (Ar) é o tempo que ela leva para passar por um ponto fixo de 
(S). Mostre que essa definição também leva à contração de Lorentz, 


8. Em 1851, H. Fizeau mediu a velocidade da luz v quando ela se propaga 
num tubo cheio de água em movimento. O escoamento da água, com velocidade V, 
é na mesma direção em que a luz se propaga. O resultado obtido por Fizeau foi 


onde z é o índice de refração da água e V << c. Mostre que esse resultado decorre 
da lei relativística de composição de velocidades. 


9. Uma régua em repouso num referencial (S') faz um ângulo 89 com a di- 
reção de movimento desse referencial, que se desloca em relação a (S) com veloci- 
dade V. Qual é o valor Q desse ângulo em (S)? 


10. Um físico está sendo julgado por ter avançado um sinal vermelho e alega 
para o juiz de trânsito que o sinal lhe pareceu verde, devido ao efeito Doppler. O 
juiz, que também estudou física, condena-o a pagar uma multa de R$1,00 para cada 
km/h de excesso de velocidade ultrapassando os 50 km/h regulamentares. Qual é o 
valor da multa? (Tome À vomemo = 6.500Å , À verde = 5.300 Â). 
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11. No Fermilab. prótons são acelerados a uma energia de 500 GeV. Ao atin- 
gir essa energia, (a) por que fator terá aumentado a massa do próton, em relação a 
sua massa de repouso? (b) que porcentagem da velocidade da luz terá sido atingida 
pelo próton? 


12. Duas fontes idênticas de luz mono- 
cromática, de frequência própria Va, 
afastam-se uma da outra (fig.) com velo- 
v cidades v e -y num referencial inercial 


(S). Qual a freqüência v de uma das fon- 
tes, quando observada pela outra? 


13. Considere o movimento relativístico de uma partícula carregada de carga q 
e massa de repouso mo num campo magnético uniforme de magnitude B. (a) Mostre 
que a energia cinética da partícula não se altera, e que a partícula descreve uma 
órbita circular se sua velocidade inicial é LB (como no caso não-relativístico). 


Mostre que permanecem válidas as fórmulas não-relativístic 


s para o raio da órbita 
e a fregiiência de cíclotron (Fís. Bás. 1, Seg. 5.4), desde que a massa empregada 
seja a massa relativística. (b) No Probi. 11, os prótons de 500 GeV são mantidos 
por um campo magnético uniforme numa órbita circular de 750m de raio. Qual é a 
intensidade do campo magnético? 


14. Uma partícula de massa de repouso my , cm repouso na origem para t = 0, 
é submetida a uma força constante Fo até o instante 1. (a) Calcule a posição x(t) 
da partícula. (b) Calcule o limite não-relativístico do resultado e mostre que con- 
corda com a previsão da mecânica newtoniana. (c) Calcule x (1) no limite de tem- 
pos muito longos. 


15. Uma partícula em repouso de massa mo se desintegra em duas outras, de 
massas de repouso m; e m. Calcule as energias E, e E, desses dois fragmentos. 
Sugestão: Use as leis de conservação e a relação (6.98). 


16. Uma partícula de massa de repouso mo e velocidade v colide com outra 
partícula idêntica, mas que está em repouso. Após a colisão, as duas partículas 


caminham juntas, formando uma partícula composta. Calcule, para essa partícula 
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composta: (a) sua massa de repouso Mo ; (b) sua velocidade V. Exprima os resul- 
tados em função do parâmetro 


1 


a =- 
-EY 


17. Uma barra de comprimento próprio Lo está em repouso no plano vertical, 
num referencial onde forma um ângulo 6º com o eixo horizontal. Esse referencial 
se move em relação a outro referencial (S), com velocidade V constante, na direção 
do eixo horizontal. 

(a) Calcule o ângulo O entre a barra e a horizontal em ($). 

(b) Calcule o comprimento L da barra em (3) 


18. Um fóton de energia E é espalhado por um elétron livre. Demonstre que a 
máxima energia cinética que o fóton pode transferir ao elétron é dada por 


onde m é a massa de repouso do elétron. 


19. Dois nêutrons 1 e 2 aproximam-se um do outro ao longo da mesma reta, 
com velocidades opostas v e -v, respectivamente, vistos do referencial do labora- 
tório. 

(a) Calcule a velocidade V de 1 em relação a 2, e verifique que é sempre 
x: 

(b) Calcule a energia total do nêutron 2 vista do referencial de 1, em função 
da massa de repouso My do nêutron. 


20. Obtenha as expressões não-relativísticas do efeito Doppler a partir da in- 


variância da fase de uma onda plana, usando a transformação de Galileu. 


21. Demonstre que um fóton, propagando-se no vácuo, não pode desintegrar- 


se em dois outros, exceto se eles tiverem a mesma direção de propagação. 
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22. Calcule. usando a mecânica newtoniana, qua! seria a velocidade de escape 
a partir da superfície de uma esfera de massa M cujo raio fosse o raio de Schwarz- 
schild (6.151). 


23. Demonstre que a curvatura K de uma esfera pode ser expressa em termos 
da área A de um círculo de raio r, por 


zr -A)| | 
K= a, lim e E 
to 


24. Uma plataforma horizontal de raio r está em rotação com velocidade angu- 
lar o em relação a um referencial inercial. (a) Para mr << c, calcule a razão 
As(r)/ At(O) entre intervalos de tempo registrados por um relógio na periferia 
e outro no centro da plataforma. (b) Associando a força centrífuga Fe a um poten- 
cial q, , pela relação F, = — V q. , mostre que, nessa aproximação, tem-se 


OS PRIMÓRDIOS 
DA TEORIA 
QUÂNTICA 


frodução 


Neste capítulo e nos próximos, vamos introduzir os conceitos básicos da trans- 
formação mais profunda pela qual a física passou desde a época de Newton: a 
física quântica. Ela constitui uma alteração muito mais radical das idéias funda- 
mentais da física do que a relatividade, que marcou num certo sentido o apogeu do 
que chamamos hoje a física clássica. 

A física clássica lida principalmente com fenômenos macroscópicos, na escala 
que nos é familiar, Secus conceitos são abstraídos dessa escal: E 


e é dela também que 
resulta nossa intuição, de modo que podemos formar imagens “intuitivas” desses 
conceitos com basc na nossa experiência quotidiana. 

Já a física quântica trata principalmente de fenômenos na escala atômica e 
sub-atômica, mais de um milhão de vezes menor do que as dimensões macroscópi- 
cas (também trata das repercussões desses fenômenos ao nível macroscópico). Co- 
mo essa escala é totalmente remota da nossa experiência, não há nenhuma razão 


para espetar que possa ser descrita pelos conceitos da física clássica. Efetivamente 


não pode: a fi 


ca quântica não se parece com nada do que vimos até agora. Daqui 


por diante, entraremos em território realmente novo! 
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É uma grande conquista da física do século 20 que ela tenha conseguido não 
apenas desenvolver conceitos adequados à nova escala, mas também tratá-los com 
grande precisão, Mais que isso: os novos conceitos e princípios vêm sendo apli- 
cados a escalas cada vez menores, até que já atingimos uma escala tão remota da 


escala atômica quanto esta o é da macroscópica: distâncias da ordem de 107? em 


ou menos, sem que se tenha encontrado até hoje qualquer indício de inaplicab 
dade da física quântica. 
Da mesma forma que a mecânica newtoniana é uma aproximação da mecânica 


relativística, válida com precisão mais que satisfatória para velocidades muito me- 


nores do que c, a física clássica é também uma aproximação da física quântica 
(princípio de correspondência de Bohr). Entretanto, a transição de uma para a outra 
é bastante mais sutil, conceitualmente, do que a transição da mecânica relativística 
para a newtoniana. 

Mesmo na escala macroscópica, conforme veremos adiante, a física era uma 
teoria bastante incompleta, incapaz de explicar inúmeros fenômenos importantes, a 
começar pela própria existência e estabilidade da matéria! 

Para alguns fenômenos, inclusive, a física clássica levava a conclusões 
inaceitáve: 


Um deles será mencionado na Seç. 7.2, porque marca a própria 
origem da teoria quântica, mas vamos nos limitar a enunciar os resultados, 
porque se trata de um fenômeno complexo, cujo tratamento teórico nos afas- 
taria muito do objetivo de introduzir de forma tão direia quanto possível os 
conceitos básicos da física quântica: trata-se da distribuição espectral da ra- 


diação térmica. 


7.2 A hipótese de Planck 


O aspecto da radiação emitida por um corpo aquecido varia com a temperatura 
desse corpo. Podemos observar o que acontece no interior de um forno em equi- 


líbrio térmico a uma certa temperatura T através de um buraquinho numa das pare- 


des, que deixa escapar um feixe de radiação. Trata-se de radiação eletromagnética, 
cujo espectro pode ser determinado experimentalmente. 

Sabemos pela experiência que, à medida que a temperatura se eleva, a ra- 
diação visível passa de uma coloração avermelhada a um vermelho vivo, depois 


vai-se tornando mais 


“branca” (filamento de uma lâmpada incandescente), tendendo 
para o azulado. O espectro é contínuo, mas a coloração dominante se desloca para 


fregiiências mais elevadas à medida que a temperatura aumenta. 
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ináteso cio D 


Hoy) 
o Fisica Clássica A uma dada temperatura F, a distribui- 


ção espectral em fregiiência da intensi- 
dade da radiação observada tem o as- 
pecto ilustrado na fig. 7.1, onde a fre- 
Experiência qüência de pico, V, cresce com T, con- 


/ 
forme observado acima. 


A predição da física clássica concorda 
muito bem com a experiência para fre- 
giências abaixo do pico, mas depois 
desvia-se cada vez mais (curva em li- 
nha pontilhada na fig. 7.1). Pior ainda: 


| 
| 
| 
| 
o 


Fig. 7.4 Distribuição espectral da radiação térmica i 
cla prediz que 1 (V) cresce como uma 


potência de v(v*). de forma que a energia total emitida pela cavidade (inte- 
grando sobre todo o espectro de fregiiências) seria infinita! Como esse efeito se 


deve às frequências elevadas, ele é chamado de * rofe ultravioleta”. 

O equilíbrio térmico da radiação no interior da cavidade ocorre através de 
trocas de energia entre a radiação e os átomos das paredes, à temperatura T: os 
átomos absorvem e reemitem a radiação. O modelo clássico para absorção e emis- 
são de radiação eletromagnética de fregiiência v por um sistema de cargas (átomo) 
é que as cargas oscilem com essa freqiiência (oscilador de Hertz: cf. Bás. 3, 
Seç. 11.5). 


Em 14 de Dezembro de 1900, Max Planck apresentou numa reunião da Socie- 


dade Alemã de Física uma proposta que permitia obter uma expressão para I (v) em 
excelente acordo com a experiência, à custa de abandonar uma das idéias mais 
arraigadas da física clássica. Classicamente, a troca de energia entre a radiação e os 
“osciladores” nas paredes se dá de forma contínua: qualquer quantidade de energia 
pode ser absorvida ou emitida. 

Para obter acordo com a experiência”, Planck pos 
“quantizad: 


ulou que a troca seria 
um oscilador de fregiiência v só poderia emi: 


ou absorver energia 


em múltiplos inteiros de um “quantum de energia” 


Planck confessou maisterde que só foi levado a formularesse postulado por “umato de desespero”, dizendo: 
“crauma hipótese puramente formal. e não lhe dei muita atenção. adotando-a porque cra preciso, a qualquer 
preço, encontrar uma explicação teórica” 
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(7.1) 


onde h é uma nova constante universal, a constante de Planck. Ela tem dimensões 
de [energia] x [tempo], correspondendo ao que se chama de ação. O valor nu- 
mérico de h é 


Th = 4136 x 10-eV -s = 6,6261 x 107º joule x segundo | (1.2) 


Na (7.1) 


É sos x 102. 


6,582 x 1018 eV -s (7.3) 


Para radiação visível de comprimento de onda À = 5.000Å, temos 
v=c/h=6x 10*s7, de forma que Av = 3,98 x 10™ J , uma energia extrema- 
mente pequena na escala macroscópica. Por outro lado, em eletronvolts, 


1 eV = 1,602 x 10”J (7.4) 


esta energia é = 2,5eV, o que absolutamente não é pequeno na escala atômica. A 
constante de Boltzmann é 


EM 
K 


1381 x 10? 


5 eV 
8,62 x 105 E> 
x10º = (7.5) 


Assim, para temperaturas T - 10°K , a energia térmica KT torna se da ordem de 1 
eV (à temperatura ambiente. KT ~ 5 ev) 
Desvios apreciáveis em relação à predição da física clássica na curva da fig. 


7.1 começam a aparecer para 
hv2 xT (7.6) 
o que podemos compreender lembrando que, em equilíbrio termodinâmico à tem- 


peratura T, a mecânica estalística indica que a probabilidade de encontrar um 
sistema com energia E deve conter um fator de Boltzmann (Fís. Bás. 2, Seg. 12.2) 
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Pea] an 


o que, pela (7.1), reduziria exponencialmente a possibilidade de trocas de energia 
com hv >> xT. É um fator desse tipo o responsável pela queda da curva de I (v ), 
eliminando a catástrofe ultravioleta. 

O postulado de quantização de Planck é, porém, inteiramente incompreensível 
na física clássica, onde a energia de uma oscilação não tem qualquer relação com 
sua fregiência: depende apenas da amplitude de oscilação, que pode variar con- 
tinuamente. 

Planck procurou por muitos anos. com grande esforço, encontrar uma expli- 
cação para o seu postulado dentro da física clássica. Acabou, muito a contragosto, 
convencendo-se de que isso não seria possível. 


7.3 O efeito fotoelétrico 


Em suas experiências de 1887, em que demonstrou a validade da teoria de 
Maxwell produzindo e detetando ondas eletromagnéticas, como vimos (Fís. Bás. 3, 
Seç. 11.5). Heinrich Hertz produzia uma descarga oscilante fazendo saltar uma 
faísca entre dois eletrodos, para gerar as ondas, e detetava-as usando uma antena 
ressonante, onde a deteção também era acompanhada de uma faísca entre eletrodos. 
Ele observou que a faísca de deteção saltava com mais dificuldade quando os ele- 
trodos da antena receptora não estavam expostos à luz (predominantemente violeta 
e ultravioleta) proveniente da faísca primária na antena emissora, ou seja, quando 
se introduzia um anteparo entre as duas para bloquear a luz. 

Curiosamente, ao comprovar a feoria de Maxwell, coroamento da física clás- 
sica, Hertz estava assim descobrindo o efeito fotoelétrico, uma das primeiras evi- 
dências experimentais da quantização. Verificou-se logo que a razão pela qual a luz 
ultravioleta facilitava a descarga era por ser capaz de ejetar elétrons da superfície 
metálica dos eletrodos. Os elétrons assim ejetados, acelerados pela diferença de 
potencial entre os eletrodos, contribuíam para ionizar o ar e facilitar a descarga. 
Hoje em dia, as fotocélulas, que têm inúmeras aplicações práticas (fotômetros, con- 
trole de portas de elevadores, 


. empregam o efeito fotoelétrico para converter um 
sinal luminoso numa corrente elétrica. 

As investigações posteriores do efeito. devidas principalmente a P. Lenard (1899), 
revelaram uma série de características intrigantes, contraditórias ao que seria es- 
perado pela física clássica. Para as experiências, o material de onde serão ejetados 
os fotoelétrons deve estar limpo e polido, para evitar quaisquer contaminações: na 
prática, isto implica que ele esteja num recipiente em alto vácuo. 


Eca Numa experiência típica, os eletrodos 
N estão dentro de uma ampola de quar- 


j |] tzo (transparente à luz ultravioleta) eva- 

Not Fooro l / cuada, e se estabelece entre eles uma 

diferença de potencial V. iluminando 

aii O; depois o catodo com luz de fregiiência 

il D E v e intensidade 7o. Mede-se a corrente 

V ssim gerada com o auxílio 
de um amperímeiro (fig. 7.2). 


elétrica i 


Fig. 7.2 Efeito fotoelétrico 


Os resultados de uma experiência típica 
| lo têm o aspecto ilustrado na fig. 7.3. Para 
s | he v fixos e um dado material do cato- 

l do, todos os fotoelétrons arrancados pela 

o coletados pelo anodo quando a 

diferença de potencial V é pos 

respondendo a uma corrente constante is 
(corrente de saturação). 

Se agora invertemos a polaridade da voltagem, procurando frear os elétrons 

em lugar de acelerá-los, a corrente continua passando no mesmo sentido, mas vai 


ls luz s 


v + Cor- 


Fig. 7.3 Variação de i com V 


diminuindo à medida que |V] aumenta, até que se anula para V = — Vr, onde 
Vr (>0) chama-se potencial de freamento. 

Se aumentarmos a intensidade, de Jo para I (fig. 7.3), o aspecto da curva 
permanece o mesmo: apenas a intensidade i da corrente, ou seja, o n.º de fo- 
toelétrons arrancados, cresce, sendo diretamente proporcional à intensidade da 
luz: duplica ao passar de J & 2 Io. 


a te Que acontece se variarmos a fregiiência 
Ultravioleta {v = 40" sec.”) 


v da luz incidente? Verifica-se que o as- 
Violeta (v=0,7x10º sec”) pecto qualitativo das curvas tende a per- 
Amarelo (v=0,5x 10"sec') manecer o mesmo; mas o valor do poten- 
É N F cial de-freamento Vr muda, aumentando 
324 TESES à medid Ega 

— V (volt) à medida que se aumento a fregiiência V, 
conforme ilustrado na fig. 7.4. A figura 
se aplica a um catodo de metal alcalino, 
o, em que ocorre efeito fotoelétrico com luz visível (mesmo assim. 


Fig. 7.4 Variação de | com a fregiiência ca luz 


como pot 


deixaria de ocorrer com luz infravermelha): para a maioria dos metais, é preciso ir 
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ao ultravioleta. O potencial de freamento Vp, para uma dada frequência v, varia de 


substância para substância: é uma característica do material. 

Como interpretar esses resultados? A produção da fotocorrente pela luz deve 
resultar de que a luz forneça energia suficiente para arrancar elétrons da vizinhança 
da superfície do material do catodo. Quando um elétron é extraído, a carga positiva 
remanescente tende a atraí-lo de volta, e é preciso fornecer energia suficiente para 
vencer essa atração. 

Como os elétrons no interior do catodo podem ter uma distribuição de ener- 
gias (num metal, existem elétrons livres) e podem provir de profundidades diferen- 
tes, os elétrons arrancados devem ter direções de movimento diferentes e veloci- 
dades (energias cinéticas) diferentes. 


Para frear um elétron de energia cinética T = 1/2 m.v” (me = massa do elé- 


tron), é preciso usar uma diferença de potencial retardadora V tal que eV = T, 
onde (-e) é a carga do elétron. Logo. o potencial de freamento deve estar asso- 
ciado a elétrons com direção de movimento perpendicular ao catodo e com energia 


ima Tm = 5 Mo Va 


cinética má 


e Va = eVr (1.8) 


Pela conservação da energia, essa energia cinética máxima deve corresponder à 
energia E fornecida pela luz menos o trabalho W necessário (valores típicos de W 
são da ordem de alguns eV) para extrair um elétron da superfície contra a força 


atrativa da carga positiva remancscente: 


m, Va = EV 5 E-W (7.9) 


onde W é uma característica do material empregado denominada função de tra- 
balho. 

O que se esperaria então segundo a teoria eletromagnética clássica? Uma onda 
eletromagnética transporta energia, que, como vimos, é diretamente proporcional à 
intensidade h da onda, qualquer que seja sua fregiiência v. Essa energia pode ser 
transferida aos elétrons do catodo, pois eles são colocados em oscilação forçada 
pelo campo elétrico da onda. 

Esperaríamos portanto que, à medida que I aumenta, aumentasse E na (7.9). 
e por conseguinte também Vr. Não é o que se observa experimentalmente: 


S cur- 
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vas da fig. 7.3 mostram que o aumento de h só aumenta a intensidade i da fotocor- 
rente (n.º de fotoelétrons ejetados). sem aumentar Vr. Por outro lado, a variação de 
Vr com a frequência v (curvas da fig. 7.4) não tem explicação clássica. 

Num trabalho publicado em 1905, intitulado “Um ponto de vista heurístico 
sobre a produção e transformação da luz”, Einstein propôs uma teoria do efeito 
fotoelétrico baseada numa extensão muito mais audaciosa” das idéias de Planck 
sobre quantização: a de que radiação eletromagnética de fregiiência v consiste de 


quanta de energia 


lE by, (7.10) 


Nas palavras de Einstein, “A idéia mais simples é que um quantum de luz transfere 
toda a sua energia a um único elétron: vamos supor que é isto que acontece”. 


A (7.9) fica então 
Z =V, =ħhv=-W (7.11) 


que é a equação de Einstein do efeito foroelétrico. Ela explica imediatamente o 
aumento de Vp com v . Como Einstein observou a seguir, 


Se a fórmula deduzida é correta, um gráfico de Vr, em função da frequência 
da luz incidente, deve resultar numa reta, cujo coeficiente angular deve ser inde- 
pendente da natureza da substância iluminada”. 

Com efeito, esse coeficiente angular, pela (7.11), é dado por h/e (h = constante 
de Planck). O físico americano R. A. Millikan não acreditou na explicação de Ein- 
stein, e passou os dez anos seguintes fazendo uma série de experiências com o 
objetivo de demonstrar que a predição de Einstein cia incuncta. O resultado foi 
que, nas palavras de Millikan. “...contra todas as minhas expectativas, vi-me obri- 
gado em 1915 a afirmar sua completa verificação experimental, embora nada ti- 
vesse de razoável, uma vez que parecia violar tudo o que conhecíamos sobre a 


interferência da luz”. 


* Para explicar a diferença entre a sua hipótese e a de Planck, o próprio Einstein fez mais tarde um paralelo 
bem humorado: “O fato de que a cerveja seja sempre vendida em garrafas não implica que acerveja consista 
de porções indivisíveis de uma garrata cada uma”. 
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Conforme ilustrado na fig. 7.5, o coefi- 
ciente angular da reta é o mesmo para di- 
ferentes substâncias, mas as intersecções 
com o eixo das abcissas são diferentes, 
correspondendo à função de trabalho W 
dividida por h. O valor de W para cada 
substância corresponde, como vimos, ao 


trabalho necessário para remover um elé- 


tron da superfície. 
Fig. 7.5 Variação de Ve com v 


O nome “fóton” para um “quantum de lu: apareceu em 1926, num tra- 
balho de G. N. Lewis. A intensidade da luz é proporcional à energia total que 
transporta, e por conseguinte ao número de fótons, o que explica por que a fotocor- 
rente é diretamente proporcional à intensidade da luz. 

Várias outras características do efeito fotoelétrico classicamente inexplicáveis 
têm explicação imediata através da hipótese de Einstein. Por mais intensa que seja, 
luz infravermelha não produz efeito fotoelétrico. Por outro lado, luz ultravioleta de 


intensidade extremamente fraca produz fotoclétrons alguns nanossegundos depois 


de inicidir sobre um material, quando, segundo a imagem clássica, levaria muito 


mais tempo para tran! 


itir energia suficiente a um fotoelétron. 


Conforme o próprio Einstein percebeu ao usar no título de seu artigo a ex- 


pres: 


o “um ponto de vista heurístico”, a equação do efeito fotoelétrico (7.11) não 
demonsira a existência de fótons: apenas pode ser interpretada dessa forma. Após a 
formulação da mecânica quântica, foi mostrado por Guido Beck * (1927) que a 
relação de Einstein resulta da quantização da matéria (átomos), sendo desneces- 
sário, para obtê-la, quantizar a radiação (fótons). 

Não foi apenas Millikan que recebeu com incredulidade a hipótese dos fótons, 
por contrariar a teoria ondulatória da luz, que cra considerada como firmemente 
estabelecida. Em 1913, quatro físicos alemães, entre os quais se incluía Planck, 
encaminharam à Academia de Ciências da Prússia uma proposta inusitada: a elei- 
ção para membro titular de Albert Einstein, que então tinha apenas 34 anos. 


= Beck, físico austríaco, veio em 1942 para a Argentina. Lá e no Brasil, deu importantes contribuições para 
a formação de escolas de física teórica. 


A proposta terminava dizendo. 

“Em suma, pode-se afirmar que não há praticamente nenhum dos grandes pro- 
blemas em que a física moderna é tão rica, ao qual Einstein não tenha dado alguma 
notável contribuição. Que ele às vezes tenha errado o alvo em suas especulações, 
como por exemplo em sua hipótese dos "quanta de luz", não pode realmente ser 
tomado como uma acusação muito séria contra ele. pois não é possível introduzir 
idéias verdadeiramente novas, mesmo nas ciências mais exatas, sem correr alguns 
riscos de vez em quando” 

O prêmio Nobel dado a Einstein, em 1921, foi pela teoria do efeito fotoe- 
létrico. 


7.4 Q efeito Compton 


Evidência mais direta de propriedades corpusculares da luz foi obtida entre 
1919 e 1923 por Arthur H. Compton, observando o espalhamento de ri 


os X mono- 
cromáticos por um alvo de grafita (Compton recebeu o prêmio Nobel de 1927 por 
esses trabalhos). 

Compton usou raios X de comprimento de onda ìo = 0,7 À . O alvo espalha a 
radiação incidente em todas as direções, e Compton usou um especirômeiro de 
Bragg para raios X (Seç. 4.11) para fazer a análise espectral dos raios X espalha- 
dos em diversos ângulos. Encontrou uma componente de mesmo comprimento de 
onda À, que a radiação incidente e outra de comprimento de onda À > M , onde o 
valor de À variava com o ângulo de espalhamento: AA = À — Ag é o deslocamento 
Compton. 


Para explic: 


r esses resultados, Compton levou às últimas consegiências a hi- 
pótese de Einstein, tratando os raios X em termos de fótons, ou seja, como partícu- 
las de energia dada pela relação de Einstein (7.10). Para ko = 0,7Ã= 7 x 10º m, 
evo = 5x 10°s "e £p (energia dos raos X meidente 2x 4,1 x 10 eV (usando 
h = 4,136 x 10™ eV- s), o que dá Ep = 18keV. 


Além da energia, a radiação eletromagnética transporta momento. Pela (6.100), 
o momento do fóton de raios X incidente é dado por 


| Pio 
| 


E F: x P A . . 
onde w é o versor da direção de propagação dos raios X incidentes. Como 
h Vo, resulta 
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= ik (7.13) 


Grafita é uma forma de carbono, e a energia dos raios X incidentes, 18 keV, é 
muito maior que a energia de ligação dos elétrons (particularmente os mais exter- 
nos) ao átomo de carbono. Compton admitiu que os raios X pudessem ser espalha- 
dos pelos elétrons do átomo, e neste caso a energia de ligação seria desprezível, ou 
seja, cada elétron se comportaria como se estivesse livre. 


Finalmente, Compton tratou então o espalhamento como uma colisão entre um 
fóton. de energia Ep e momento py, 
Devido ao recuo do elétron na colisão, o fóton espalhado tem energia E, < E, OU 
, comprimento de onda À > À, conforme observado. 

Para encontrar de que forma À depende do ângulo de espalhamento 8 dos raios 
X, Compton aplicou as leis de conservação da energia e do momento na colisão, 


e um elétron livre, inicialmente em repouso. 


sej 


em forma relativística, porque o fóton é uma partícula relativística. 
JE, p) Sejam E, e py energia e momento do 
es du N 
a gE főton espalhado na direção u, e (E, p) 
a energia e momento do elétron após a 
colisão (recuo). 


As leis de conserva relativísti- 


cas dão então: 


En tm, 


(7.15) 


(7.16) 


A (7.14) dá 


+ 2 (E Gi E, Jo + m id 


P = (Ep -E eme) = Ep- 
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ou seja 
E md =(Eo- 2(Eo Eme =p'e (7:17) 
Por outro lado, a (7.15) dá 
Pe = (Ep ês -E â) = Eo) +E) -2E Ecos0 (18) 


pois i- ú = cos 8 (veja a fig. 7.6). 
Substituindo a (7.18) na (7.17) e cancelando os temos idênticos, resulta 


(Eo - E, )m Č = Eyo E, (1 - coso) 


1 —cos6 
T i leo) (119) 
E Ba me 
Mas, pela relação de Einstein. E epa u » e da mesma forma para Ey 
Ep hvo h 
f ii ! 
nie bo) 4 ) (1 — cos 0) | Deslocamento Compton (7.20) 
mac) ] 


que dá a variação de comprimento de onda em função do ângulo O de espalha- 
mento. 

A constante ta . onde mo é a massa de repouso de elétron. é chamada de 
comprimento de onda Compton do elétron. Substituindo os valores numéricos de 


h, my è c, obtemos 


| 
A = Das 2,426 x 10“m = 0,02426 À | (1.21) 
| me | 


Compton verificou experimentalmente tanto o valor absoluto do deslocamento 
quanto sua dependência angular. Conforme já foi mencionado, a radiação espalhada 


do núcleo 257 


também contém uma componente de comprimento de onda Ay. Seu aparecimento 
pode ser explicado como resultante do espalhamento não por um elétron, mas pelo 
átomo como um todo. Como a massa do átomo de carbono é 4 ordens de grandeza 
maior do que a massa do elétron, o deslocamento correspondente é desprezível. 

A interpretação de Compton recebe confirmação adicional quando se observa 
o elétron de recuo. Isso foi feito por G. N. Cross e N. F. Ramsey em 1950, usando 
raios y de 2,6 MeV. O ângulo q de recuo do elétron (fig. 7.6) foi verificado, con- 
cordando com seu valor teórico. Também foi verificado experimentalmente, por Z. 
Bay et al. (1955), que o elétron de recuo e o fóton espalhado emergem em coin- 
cidência (ao mesmo tempo), com precisão da ordem de 107!!'s . Logo, o tratamento 
do efeito Compton como uma colisão entre duas partículas (fóton e elétron) ficou 
plenamente justificado. 


7.5 Rutherford e a descoberta do núcleo 


Nos primeiros anos deste século, J. J. Thomson, o descobridor do elétron, pro- 
curou construir um modelo da estrutura de um átomo. Sabia-se que um átomo con- 
tém elétrons, que as massas atômicas são muito maiores que a massa de elétrons, e 
que o átomo é eletricamente neutro, com dimensões típicas da ordem de 
i" m (=1Ã9). 

Thomson propôs então um modelo em que a carga positiva estaria distribuída 
uniformemente dentro de uma esfera com as dimensões do átomo, e os elétrons 
estariam dentro dessa nuvem positiva (como passas num bolo). Pelo teorema de 
Earnshaw (Fís. Bás. 3, Cap. 3), essa distribuição não poderia estar em equilíbrio 
estável sob a ação puramente de forças eletrostáticas. 

Entretanto, os elétrons poderiam mover-se dentro da nuvem. Aplicando u mo- 
delo ao hidrogénio, o elétron poderia ter um movimento de oscilação radial, com 
frequência correspondente à luz visível (Fís. Bás. 3, Probl. 3.10) — embora isto 
não explicasse o espectro do átomo de hidrogênio. que contém uma série de 
frequências diferentes: o modelo só daria uma. 

Ernest Rutherford, natural da Nova Zelândia, foi o sucessor de J. J. 
Thomson no Laboratório Cavendish da Universidade de Cambridge. Ruther- 
ford desenvolveu inúmeros trabalhos experimentais empregando as radiações 


emi 


das por substâncias radioativas: partículas œ (Hc?) , B(e) ey (fótons 
de energia elevada). 
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Fig. 7.7 Espalhamento Rutherford 
Em 1909, dois assistentes de Rutherford, Geiger e Marsden, observaram o es- 


palhamento de partículas œ por uma lâmina delgada de ouro, utilizando o disposi- 
tivo experimental da fig 77 Ima fonte de radinm emite partí 


ulas a , de velnci- 
dade v = 1,52 x 10° m/s. Um feixe colimado de œ incide sobre uma folha de ouro 
muito fina, de espessura ~ 10 mm , o que equivale a alguns milhares de camadas 
atômicas. 

As G espalhadas numa direção O eram detetadas pelas cintilações provocadas 
pelo seu impacio sobre uma tela de sulfeto de zinco. observadas através de um 
microscópio. O ângulo de observação @ era variável, e o aparelho estava numa 
câmara evacuada, para evitar que as O do feixe fossem espalhadas por moléculas 
de ar. 

Como a massa de uma œ é ~ 8.000 vezes a do elétron, uma colisão com um 
elétron praticamente não desviaria a O de sua trajetória. Por outro lado, se valesse 
o modelo de Thomson, a carga positiva do átomo estaria uniformemente distribuída 
dentro do raio atômico, e também não poderia produzir desvios muito grandes na 
trajetória da a (mesmo cumulativos, por espalhamento múltiplo, pois tenderiam a 
se cancelar). 

De fato, nas primeiras experiências, só se observaram desvios muito pequenos, 
como se a folha de ouro fosse praticamente transparente ao feixe de œ . Rutherford 
relata o que aconteceu em 1910: 


“Um dia Geiger veio ver-me e disse: "Não seria bom que o jovem Marsden, 
que eu estou treinando em métodos radioativos, iniciasse uma pequena pesquisa?" 
Eu também tinha pensado nisso, e disse: “Por que ele não olha se há partículas a 
espalhadas em grandes ângulos?” Aqui entre nós, 
pois a O era uma partícula de massa e velocidade elevadas, portanto de grande 
energia, e podia-se mostrar que, se o espalhamento resultasse do efeito cumulativo 
de um grande número de pequenas deflexões, a probabilidade de que uma & fosse 


retroespalhada seria muito pequena. Lembro-me então de que. dois ou três dias 


eu não acreditava que houvesse, 
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depois, Geiger veio ver-me extremamente excitado. dizendo: “Conseguimos obter 
algumas partículas o espalhadas para trás...”. Foi a coisa mais incrível que jamais 
me aconteceu em toda a minha vida. Era quase tão incrível como se se disparasse 
um obus de 15 polegadas contra um lenço de papel e ele fosse defletido para trás 


atingindo você.", 

E mais adiante: “Refletindo, percebi que esse retroespalhamento deveria ser 
produzido por uma única colisão, e fazendo as contas vi que seria impossível obter 
qualquer coisa dessa ordem de grandeza, exceto num sistema em que a maior parte 
do átomo estivesse concentrada num núcleo diminuto. Foi então que tive 


a idéia de um átomo com a carga (positiva) e massa concentradas numa minúscula 


região central”. 

É fácil estimar até que distância do centro, onde se concentra a carga positiva 
de um átomo de ouro, uma partícula œ da energia empregada na experiência precisa 
chegar para ser retroespalhada (Fís. Bás. 3, Probl. 4.6). O resultado, conforme foi 
estimado por Rutherford, é uma distância ~ 10 em, ou seja, ~ 10° vezes menor 
que o raio do átomo. Esse é então um limite superior para o raio do núcleo. Isso 
significa que a matéria é. em grande parte, espaço vazio. Ao mesmo lempo, veri- 
fica-se a validade da lei de Coulomb até distâncias dessa ordem! 

Rutherford usou a mecânica clássica para calcular a fre 
es entre 0 e O + dO (as órbitas são 


são dF das partículas 


incidentes que é espalhada em diferentes dir 


hiperbólicas: o problema é análogo ao de um cometa na gravitação). Os resultados 
foram comparados com as experiências de Geiger e Marsden, mostrando bom acor- 
do e completando assim a justificativa da existência do núcleo e do modelo atô- 


mico de Rutherford. 


© A força coulombiana responsável pela de- 
flexão (fig. 7.8) é proporcional ao produ- 
to da carga 2e da q pela carga Ze do 


Partíoula œ, 
carga 2e 
núcleo. Logo, determinando-se experi- 


mentalmente a fração dF espalhada entre 
© c 0 + d0 pode-se medir a carga nu- 
Ze. 
Fig. 7.8 Deilexão colombiana ici 
Os resultados obtidos por Chadwick para Z coincidiam, dentro do erro experi- 
mental, com o número atômico do elemento utilizado como alvo, ou seja, com o 
seu número de ordem na tabela periódica dos elementos: 1 para H, 2 para He, 3 
para Li, 
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Rutherford e sua escola estabeleceram assim experimentalmente que o átomo con- 
siste de um núcleo de carga Ze e dimensões g 107? cm, que concentra quase toda a 
massa atômica, e Z elétrons distribuídos em dimensões ~ 10™ em em torno dele. 


7.6 Espectros atômicos 

A primeira evidência experimental significativa” sobre espectros atômicos es- 
tava contida na descoberta, feita por Fraunhofer em 1814, de uma série de linhas 
escuras no espectro solar (“raias de Fraunhofer”). “ 


Em 1859, Kirchhoff e Bunsen descobriram que o espectro de emissão de um 


elemento, formado por uma sé 
as linhas obtidas s 


ic de fregiências bem definidas (Linhas espectrais: 
o imagens da fenda do espectroscópio), é característico desse 
elemento. Asim, a emissão do vapor de sódio (obtida, por exemplo. lançando sal de 
cozinha na chama de um bico de Bunsen) contém duas linhas muito próximas no 
amarelo, responsáveis pela cor amarela da luz emitida. Os dois mesmos compri- 
mentos de onda aparecem como linhas escuras entre as raias de Fraunhofer. 

Esse último fato foi interpretado como significando que as linhas escuras for- 


mam o espectro de absorção. A radiação térmica solar, que tem um espectro con- 
tínuo, é parcialmente absorvida ao atravessar a atmosfera do Sol, e as linhas es- 
curas sinalizam a presença do elemento ao qual estão associadas (sódio, por exem- 
plo) nessa atmosfera. Essa descoberta de Kirchhoff e Bunsen serviu de basc à aná- 
lise da composição química das estrelas em astrofísica, através do scu espectro de 
absorção — em particular, permitiu identificar o desvio Doppler para o vermelho e 
descobrir a expansão do Universo (Scç. 6.8). 


Visível 
n=3 4 5 678 M 
T 1 
Hj HJ H | o 
il {1I continuo 
A=6562,8 À 4861,3 4340,5 4101,7 36456 (imite de 
Vormalho Azul Violeta Ultravioleta convergência) 


Fig. 7.9 Espectro do H 
No espectro de emissão do hidrogênio arômico (H, não Ho), p. cx., aparece na 
região do visível, estendendo-se até o ultravioleta, um conjunto de raias que vão-se 
aproximando cada vez mais umas das outras (fig. 7.9), tendendo a um ponto de 
acumulação. 


* Thomas Melvill já havia observado espectros de emissão de gases em 1752, mas com resolução muito pobre. 


#* William Wollaston havia visto algumas linhas escuras em 1802. 
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Em 1885. Johann Balmer, um professor secundário em Basel, encontrou uma 
formula empírica que reproduzia com grande precisão (dentro de 0,02%) as posi- 


ções desse conjunto de raias: 


onde C é uma constante, que Balmer tomou = 3645,6 Å . Note que C é o limite da 
série: O = Lo. 

Uma forma mais sugestiva de apresentar esse resultado é em termos de inver- 
sos de comprimentos de onda: 


È el Es >) (e =3,4,...) | (Balmer) (7.23) 


onde Ry = 4/C chama-se constante de Rydberg para o hidrogênio. Seu valor é 


Ry = 109.677 em 


(7.24) 


A linha Ha no vermelho é responsável pela cor avermelhada de uma descarga num 
tubo com hidrogênio. A série de linhas espectrais dada pela (7.23) chama-se série 
de Baimer. 

Em 1906, Lyman descobriu outra série de linhas no ultravioleta distante no 
espectro do H, com 


) (n=2,3...) yman) (1.25) 


e em 1908 Paschen descobriu outra série no H, dada por 


; = tals E 5) (1 = 4,5...) (Paschen) (1.26) 
n n 


esta no infravermelho. 
Todas essas séries são da forma geral 


) (= m+timt2,) (1.27) 


Es 
"g 
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e são casos particulares de uma regra geral, associada ao princípio de combinação 
de Rydberg e Ritz. segundo a qual linhas espectrais podem sempre ser represen- 
tadas como diferenças de dois termos espectrais: 


a non (7.28) 


de forma que. sc duas fregiiências v; e vz (v = c/A) aparecem num espectro, 
podemos esperar que também apareçam vi + V2 € Iv; — val 


1 


Por exemplo, a 1.° linha da série de Lyman tem 1/A dado por Rg (' - 1) ea 


1.º da série de Balmer por Ry (1-5) a combinação das duas dá Rẹ (a -4 que 
V X 
é a 2º linha da série de Lyman. 
Todos esses resultados cram incompreensíveis pela física clássica. O modelo 
clássico de emissão de luz monocromática. como vimos, era o oscilador de Heri 


que só emite a fregiiência de oscilação v. Sistemas oscilantes mais gerais podem 
emitir também harmônicos dessa frequência, como 2v , 3v , .... mas não há nada 
que se pareça ao princípio de combinação de Rydberg-Ritz nem às séries espec- 
trais, como as do H. 


7.7 O modelo atômico de Behr 


Os resultados de Rutherford trouxeram um novo desafio para a compreensão 
da estrutura do átomo, mostrando que o modelo de J. J. Thomson era inadmissível. 
Um modelo eletrostático era excluído pela impossibilidade de levar a uma configu- 
ração de equilíbrio estável (teorema de Earnshaw). 

Modelos dinâmicos do tipo de um sistema planetário, com os elétrons orbi- 
tando em torno do núcleo. haviam sido considerados, mas também apresentavam 


uma dificuldade insuperável dentro da física clássica. 

Em qualquer órbita descrita em torno do núcleo, um elétron está continua- 
mente se movendo com aceleração O . Mas uma carga acelerada, de acordo com 
a teoria de Maxwell, emite radiação, e por conseguinte perde energia, tendendo a 
aproximar-se do núcleo. A órbita se transforma numa espiral, que acaba levando à 
captura dos elétrons pelo núcleo e ao colapso do átomo. Para uma órbita de dimen- 
sões atômicas, esse colapso ocorre num tempo inferior a 10” s! Logo, conforme já 
Toi observado na Seç. 7.1, a física clássica não consegue sequer explicar a existên- 
cia de átomos e a estabilidade da matéria. 
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Em 1912, Niels Bohr transferiu-se do laboratório de J. J. Thomson em Cam- 
bridge para o de Rutherford, que nessa época estava em Manchester. Bohr procurou 
interpretar os resultados de Rutherford construindo um modelo para o átomo mais 
simples, o de H, com base nas idéias de Planck e Einstein sobre quanti 


o. 


Bohr, percebendo que a teoria clássica não poderia explicar a estabilidade do 
átomo em seu estado normal 
emitir radiação, resolveu simplesmente postulá-la, admitindo a existência de 
estados esiacionários com estas características. 


com o elétron orbitando em torno do núcleo sem 


Dc acordo com a mecânica clássica. o problema de um elétron orbitando em 
torno de um próton no átomo de H, sujeito apenas à força coulombiana, é inteira- 
mente análogo ao problema de Kepler de dois corpos na gravitação, levando a ór- 
bitas em geral elípticas, como as dos planetas, podendo haver. como caso particu- 
lar, órbitas circulares (Fig. 7.10). Bohr resolveu considerar esse caso mais simples. 

Se r é o raio de uma órbita circular e v a velocidade com que ela é descrita, 
sabemos que v é constante pela conservação do momento angular L (0 campo é 
central): 


L=mvy r = constante ] (7.29) 


A aceleração a do elétron é puramente 
centrípeta, 


a=-> f (7.30) 


A única força que atua é a força coulom- 


biana entre o elétron e o próton, 


(7.31) 


Fig. 7.10 Órbita circular 


onde, para simplificar, fizemos 
| P = ê 7 (ane) (1.32) 


Obtemos portanto 


(7.33) 


Tomando o nível zero de energia total no infinito, ou seja, com o elétron “infini- 
tamente” afastado do núcleo e em repouso, a energia E do sistema é 


(7.34) 


pela (7.33) 


onde o sinal (—) se deve à escolha do nível zero para E: é preciso fornecer energia 
para levar o elétron até o “infinito”. 

Quando o átomo emite luz, sua energia tem de diminuir. Usando a (7.34), 
Bohr as: 
passaria de um valor inicial 7; a um valor final rẹ: 


sociou essa variação de energia A E a uma variação do raio da órbita, que 


sA 2) (7:35) 


Bohr bascou-se na teoria de Einstein do efeito fotoelétrico para associar essa va- 
riação de energia à fregiiência v do fóton emitido usando a relação 


Abraço iv = (7.36) 


o que dá. levando na (7.35), 


(7.37) 


que já tem a estrutura de uma diferença entre dois termos espectrais, como a (7.28). 

Um espectroscopista havia informado Bohr sobre as fórmulas empíricas para o 
espectro do H. “Assim que vi a fórmula de Balmer”, disse Bohr, “tudo se tornou 
claro para mim”. 
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Se identificarmos cada termo da (7.37) com a (7.27), inferimos, com efeito, 


È Ry 
2her, nº ud) 
ou Seja, que os raios das órbitas são dados por 
hn (8=1,2,3,.0) (7.39) 
onde 
| RAIO DE BOHR (7.40) 
(da menor órbita, n = 1) 
(141) 
com |cf.(7.36)] 
2 
E Eh (7.42) 
2a 


dando a freqüência da linha espectral emitida na passagem de n para m. 

A (7.40) relaciona o raio da 1.º órbita de Bohr com a constante de Rydberg, 
que é determinada experimentalmente. Mas Bohr conseguiu relacioná-la com outras 
constantes físicas fundamentais usando seu princípio de correspondência (Seç. 
7.1), a idéia de que a física clássica deve ser obtida como caso limite. 

No limite em que o “número quântico” n se torna muito grande, a (7.39) 
mostra que o raio da órbita correspondente cresce rapidamente, aproximando-se de 
dimensões macroscópicas. Hoje em dia, embora isso seja altamente não trivial, sa- 
be-se preparar átomos nessa situação, p. ex., com n > 50, que são chamados áto- 
mos de Rydberg. 

Se considerarmos então uma transição entre duas órbitas vizinhas, 


n+ | > n, a variação fracionária de raio é muito pequena, e podemos considerar 
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que o elétron permanece numa única órbita circular quase macroscópica. A fre- 


quência v da radiação emitida nessa transição é, pela (7.42). 


=2n 


sa 
1 & (n+1) 


á e 2han? (n+ 1) 


ou seja, para n >> l, 


š 
Pa 
Farm g n>> | 7.43) 
alon han? ( ) (7.43) 


Mas nesse caso a física clássica, que deve resultar como caso limite, prevê que a 
frequência da radiação emitida coincide com a fregiência do movimento circular 
uniforme ao longo da órbita, 


=-——E— (Fregiência clássica) (7.44) 
LTR a 


onde, pela (7.33). 


de modo que 


2 a T . 1 = Cl 
eae Rio 


(7.45) 


Como v, = 1/%, onde T, É O período, e n? ao = rn, à (7.45) não passa da 3º lei de 
Kepler: os quadrados dos períodos são proporcionais aos cubos dos raios das órbi- 
tas correspondentes (Fís. Bás. 1, Seç. 10.4). 

Usando o princípio de correspondência, a (7.43) dá 


| =a aa a (7:46) 
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e, comparando com a (7.45), resulta [ef. (7.32)] 


(7.47) 


2 


2 a 
Ei nd a 
Ex) ma) Fal Loma nme | 


que exprime o raio de Bohr em função de constantes fundamentais da física. 
Substituindo os valores numéricos 


£ = 8854x102F/m,h= 6626 x 10 
m = 9,109 x 10 kg , o — 1,602 x 107º C 


acha-se 
La = 529 x10" m (7.48) 
e a (7.40) dá o valor da constante de Rydberg Ru correspondente: 
|a sar ag" ER | (1.49) 
Substituindo os valores numéricos, acha-se Ra = 109.600cm™', o que já con- 


corda bastante bem com o valor experimental (7.24). A concordância ainda melhora 
quando se leva em conta que o próton foi tratado como em repouso (massa infi- 
nita), quando na verdade deveríamos ter usado o referencial do CM e a massa 
reduzida (Fis. Bás. 1, Seç. 10.10). Esse foi um grande sucesso da teoria de Bohr. 
A expressão do raio de Bohr em termos da constante de Planck e da carga e 
massa do elétron foi um marco na história da física, definindo a escala atômica de 
tamanho. Como observou Dirac, “grande” e “pequeno” deixaram de ser conceitos 
relativos, com a introdução, pela primeira vez, de uma escala absoluta, baseada em 


constantes universais da Natureza. 

Entretanto, a condição (7.38), que seleciona os raios das órbitas circulares, foi 
obtida identificando a (7.37) com a fórmula de Balmer. Haveria alguma justifica- 
tiva teórica para essa regra de seleção? 

Pelas (7.29) e (7.33), o quadrado do momento angular La do elétron na órbita 
de raio rn é 
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2 e e E” 
mn =m aqn =h 
z 


pela (7.47) 


ou seja, 


(7.50) 


Isso significa que os raios das órbitas correspondem à guantização do momento 
angular em unidades de h. As dimensões do momento angular são as mesmas da 
ação. 

Refazendo em sentido inverso o caminho que nos levou a esses resultados, 
vemos que o modelo atômico de Bohr pode ser deduzido a partir das seguintes 
hipóteses: 

(Œ) ESTADOS ESTACIONÁRIOS: Existe no átomo um conjunto discreto de 
estados chamados de “estacionários”. Pelo menos o estado estacionário de energia 
mais baixa [dado pela (7.41) com n = | para o H], chamado de estado fundamental, 
é realmente estacionário, no sentido de ser estável: o átomo pode permanecer nele 
indefinidamente. 

Esses estados correspondem a órbitas eletrônicas em torno do núcleo, que 
Bohr calculou usando as leis da mecânica newtoniana e considerando somente ór- 
bitas coulombianas circulares. 

Esta hipótese já viola a teoria eletromagnética clássica, segundo a qual a ace- 
leração do elétron nessas órbitas levaria à emissão de radiação, fazendo-o espiralar 


para dentro do núcleo. 
(II) CONDIÇÃO DE QUANTIZAÇÃO DE BOHR: Os estados estacionários 
são aqueles que satisfazem à condição de quaniização do momento angular (7.50). 
UM) CONDIÇÃO DE FREQUÊNCIA DE BOHR: Quando um elétron passa 
de um estado “estacionário” de energia E, para outro de energia En, a diferença 
de energia corresponde, se E, > Em , à emissão de um fóton, de fre 
por 


Yaon = (E, — En) / ho (1.51) 


Também pode ocorrer o processo inverso, em que o átomo passa de E, para 
E, por absorção de um fóton dessa frequência (espectro de absorção). 
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chamados de 


Pode-se perguntar por que os estados com n = 2,3, 4, 
“estacionários 


uma vez que tendem a passar para o estado fundamental n = 1, 


com emissão de um fóton da série de Lyman. A razão é que o período de revolução 


numa órbita é da ordem de grandeza do período da luz visível, ou seja, ~ 107“ s, 
ao passa que a “vida média” para emissão de radiação é tipicamente ~ 10° s, de 
forma que o elétron, no modelo de Bohr, descreve um grande número de revo- 
luções numa órbita antes de passar para outra. 
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Fig. 7.11 Diagrama de termos de H 


A fig. 7.11 mostra um “diagrama de termos”, no sentido da (7.28), ou, o que 
é equivalente, dos níveis de energia dos estados esiacionários, previstos pela teoria 


de Bohr para o átomo de H. 
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Com a escolha feita do nível zero de energia, a energia do estado fundamental 
do H, pelas (7.41) e (7.49). é 


h= 4136 x 10 
č= 3AN as 
Ry = 109.677 cm 


-13,6 eV 


Isso significa que é preciso fornece: 13,6 eV av átomo uu seu estadu funda- 
mental para remover o elétron até uma distância “infinita” do núcleo com energia 
zero, ou seja, para ionizar o átomo de H. Esse resultado concorda com o valor 
experimental da energia de ionização do H. 

Se fornecermos mais do que esta energia, o elétron não só será ionizado, como 
ainda terá uma energia cinética positiva, que pode variar de forma contínua. Por 
isso, a região hachurada acima de n = œ na fig. 7.11 foi marcada “espectro con- 
tínuo”. Como o elétron não está mais ligado ao núclco. podemos pensar nesses 
estados como representando o espalhamento de um elétron por um próton. 

A energia de excitação mínima que é preciso fornecer ao elétron para removê- 
lo do estado fundamental é aquela correspondente à transição para o 1.º estado 
excitado. n = 2, dada por [cf. (7.42)] 


x 13,6eV = 102eV. 


Os experimentos de Franck e Hertz 
Uma verificação experimental importante das idéias de Bohr. em particular do 
conceito da energia de excitação mínima de um átomo, que acabamos de discutir, 
foi obtida numa série de experimentos de James Franck e Gustav Hertz” realizados 
a partir de 1914. Até então, o caráter quantizado de transferências de cnergia tinha- 
se restringido essencialmente à emissão e absorção da radiação. Os experimentos 


* — Não confundir com Heinrich Hertz, que verificou a teoria de Maxwell. 
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de Franck e Hertz foram os primeiros a demonstrar o caráter quantizado de trans- 
ferências de energia em que a energia transferida era energia cinética, com a trans- 
ferência efetuada através de colisões. 


O arranjo experimental mais simples que 
empregaram está ilustrado na fig. 7.12. 
Num tubo contendo vapor de mercúrio a 


Regiēolie Þaixa pressão, elétrons emitidos por um 


decampo filamento incandescente C (catodo) são a- 


celerados por uma diferença de potencial 
5 Vo variável até o anodo, que é uma grade 
Fig. 7.12 Experimento de Franck e Heriz kaa pos K 
G. cujos interstícios os elétrons podem 
atravessar, penetrando depois numa região livre de campo elétrico, onde a veloci- 
dade v adquirida pelos elétrons acelerados se mantém, enquanto eles não colidem 
com átomos de Hg. 


A energia cinética adquirida pelos elétrons que atravessam a grade é 


ymy =e% (7.53) 


(a energia térmica da emissão pelo filamento é desprezível em confronto com e Vo). 

Aumentando gradualmente Vy , verifica-se que o vapor de mercúrio permanece 
escuro, até que se atinge o valor Vo = 4,88 V, quando ele começa a cmitir radiação 
com À = 2537À, característica do Hg. 

Usando a “condição de frequência” de Bohr (7.51). a diferença de energia 
associada à fregiiência v = c/A, com À = 2537Á, é hv ~ 4,88€V. Logo, a inter- 
pretação do resultado experimental é: enquanto o potencial acelerador é -insufi- 
cicute para comunicar aos elétrons essa energia cinética. eles não podem transferir 


aos átomos de Hg com os quais colidem a energia de excitação mínima necessária 
para removê-los do estado fundamental. 


Assim que é atingido o limiar de excitação de 4,88 eV, começam a ocorrer 
colisões inelásticas entre os elétrons e os átomos, em que energia cinética dos 
elétrons é convertida em energia de excitação e depois reemitida sob a forma de 
radiação de 2537 À. 

Também foram observados limiares associados a transições para outros níveis: 
estas experiências constituem um dos primeiros exemplos de bombeamento atômi- 
co, em que um átomo é transferido de seu estado fundamental a algum de seus 


estados excitados de forma controlada, no caso através de colisões com elétrons. 
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Além disso, também foi determinada experimentalmente por Franck e Hertz a 
energia necessária para ionizar os átomos, que corresponde à transição do estado 
fundamental para o espectro contínuo; o valor de Vo correspondente é o potencial 
de ionização, e concorda com aquele inferido espectroscopicamente pelo limite de 
uma série de linhas espectrais 


7.8 As ondas de de Broglie 


Em 1923, o físico francês Louis de Bri 
doutoramento, sugeriu uma série de idéias especulativas, baseadas nos resultados 
até então obtidos para fótons, na teoria de Bohr, e na analogia ótico-mecânica (Seç. 
ZHL 

Para os fótons, como vimos no tratamento do efeito Compton, manifestam-se 
efeitos que os caracterizam como partículas, mas que ao mesmo tempo dependem 
de suas propriedades ondulatórias, como a relação (7.13) entre a magnitude do 
momento p do fóton e o seu comprimento de onda À: 


ie, que es 


preparando sua tese de 


|p=} =ar] (7.54) 
O aparecimento de números inteiros na condi de Bohr para 


as órbitas dos elétrons no átomo de H foi uma pista importante. Na as palavras de de 
Broglie, 


“A determinação do movimento estacionário dos elétrons no átomo introduz 
números inteiros; ora, até aqui os únicos fenômenos em que intervinham inteiros na 
física eram os de interferência e modos normais de vibração. Esse fato me sugeriu 
a idéia de que também os elétrons não deveriam ser considerados somente como 
corpúsculos 

Assim, a contrapartida das propriedades corpusculares da luz. antes conside- 
rada como onda, seriam propriedades ondulatórias dos elétrons (mais geralmente. 
de outras partículas), até então tratados como corpúsculos. Por analogia com a (7.54), 
de Broglie postulou que o comprimento de onda associado a partículas (não-rela- 


mas de que deveriam estar 


ociados com periodicidade”. 


tivísticas) de momento p = mv, seria 


(7.55) 


que se chama o comprimento de onda de de Broglie da partícula. 
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Qual seria o valor de À para elétrons de diferentes energias E? Para um elétron 
livre não-relativístico. a energia é puramente cinética: 


[p= 2mE | [z=] (1.56) 


Para um elétron de 1 eV, temos: 
E = 1,602 x 103, m = 9109 x 10°'kg , h = 6,626 x 10™]. s, 
o que dá 


Ae) =122x10ºm=122Ã 


ou seja 


22À , para 10º eV, À = 0,122Å; 
muito acima disso, já seria preciso usar a energia relativística. Por outro lado, para 
prótons de 1 keV, seria À = 0,009Á (devido a Mp = 1836m. ). 

Os pequenos valores de À mesmo para partículas da escala atômica explica- 
riam por que as propriedades ondulatórias teriam passado desapercebidas. Confor- 


me observou de Broglie, é a mesma razão pela qual as propriedades ondulatórias da 


Assim, para um elétron de 100 eV, tem-se À = 


luz visível passam, normalmente desapercebidas, permitindo que se empregue a óti- 
ca geométrica em lugar da ótica ondulatória. 

Durante a defesa de tese, Jean Perrin perguntou a de Broglie se as suas ondas 
poderiam ser detetadas experimentalmente. A resposta de de Broglie foi que isso 
talvez fosse possível fazendo experiências de difração de elétrons por cristais. 


Sem que Perrin ou de Broglie soub: 


ssem, já existiam alguns dados experimen- 
tais nessa ocasião indicativos do efeito, em experiências no laboratório de C. H. 
Davisson em N. York, de espalhamento de elétrons por amostras cristalinas de ní- 
quel (foi um antecessor dos laboratórios da Bell). 
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Entretanto, efeitos muito mais claros apareceram nessas experiências por aca- 
so, devido a um acidente ocorrido no laboratório em 1925: uma garrafa de ar líqui- 
do explodiu, levando © alvo de níquel a ficar oxidado. Para eliminar o óxido, o 
alvo foi submetido a um tratamento térmico que o transformou, de um agregado 
policristalino, em pequeno número de monocristais. O resultado foi uma mudança 
radical na distribuição angular dos elétrons espalhados: apareceu um pico intenso 
correspondente a um ângulo de desvio de 50º, para um feixe de elétrons de 54 ev. 


feixe | incidente 


T 7 y feixe 


difratado 


Por difração de raios X sabia-se que o espaçamento D entre átomos de Ni na su- 
perfície era de 2,15 À. 

Se o feixe de elétrons sofre difração de Bragg por uma família de planos reti- 
culares que forma um ângulo O com a superfície (fig. 7.13), o espaçamento entre os 
planos é d = D sen9, e a condição de Bragg (4.89) dá, param = 1, 


2DsenBcosB = Dsen(26) (7.58) 


Mas 29 é o ângulo de desvio (fig. 7.3), de modo que 
À = 215Ã sen 50°= 1,65 À 


ao passo que a (7.57) daria À = 1,66Á . Confirmou-se assim que o pico a 50º era 
devido à difração de Bragg dos elétrons pelo cristal de Ni. 

Vimos na Seç. 4.11 que outra técnica de difração de raios X é o método dos 
pós cristalinos de Debye e Scherrer, em que o agregado de microcristais do pó 
tem faces distribuídas ao acaso, levando à formação de anéis concêntricos de 
difração. 


Experiências análogas de difração de elétrons foram feitas cm 1927 por G. P. 
Thomson, mostrando os anéis de difração esperados. 30 anos antes, em 1897, o pai 
de G. P. Thomson, J. J. Thomson. havia descoberto o elétron, tendo ganho o Prê- 
mio Nobel de 1906 pela identificação dos elétrons como corpúsculos. Em 1937, 
juntamente com Davi 
elétrons são ondas! 


son, G. P. Thomson ganhou o Nobel — por demonstrar que 


Em 1929, I. Estermann e O. Stern demonstraram a difração de partículas neu- 
tras: átomos de He e moléculas de 
Broglie também neste caso. Posteriormente, foram feitas experiências de difração 


2, veri 


cando a validade da relação de de 


com nêutrons, levando a técnicas valiosas de investigação da estrutura de cristais, 
complementares à difração de raios X. 

Vimos até aqui os eventos mais importantes que precederam a formulação da 
teoria quântica, correspondendo à “velha teoria quântica”, desenvolvida durante o 
primeiro quarto deste século. A característica principal dessa era foi a abordagem 
heurística. fenomenológica, procurando encontrar aspectos da nova dinâmica do 
mundo atômico e subatômico de forma semi-empírica. ` 

Embora tenha obtido alguns sucessos notáveis, a velha teoria quântica tinha 
defeitos muito sérios. Em primeiro lugar, era uma mistura extremamente arbitrária 
de física clássica com novos postulados alheios c contraditórios à física clássica. 
Além disso, o modelo atômico de Bohr nunca pôde ser extendido a átomos com 


mais de um clétron “ótico”, isto é, envolvido nas transições que dão origem ao 


espectro ótico: por ex.. ao átomo de He. Mesmo para o átomo de H, conforme 
veremos, a predição da teoria de Bohr para o momento angular no estado funda- 
mental (L = A) é incorreta: o momento angular é nulo 

Na avaliação de Einstein: “Que essas bases incertas e contraditórias tenham 
permitido a Bohr descobrir as leis que regem as linhas espectrais e as camadas 
eletrôni 
mo um milagre”. 


dos átomos, bem como seu significado para a química, pareceu-me co- 


7.9 A equação de Schrödinger 
para estados estaciomários 


Os trabalhos de de Brogli 
dulatórios associados a partículas, não haviam tido muita repercus 
portância' foi logo reconhecida por Einstein 


antes da confirmação experimental dos efeitos 


on- 


mas sua im- 


Em 1926, Peter Debye, que estava na Escola Politécnica Federal de Zürich, 


organizava, juntamente com Erwin Schrödinger, seu sucessor na Universidade de 
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Zürich, um colóquio conjunto. Conversando sobre a teoria de de Broglie, concor- 
daram que não a entendiam, e Debye pediu a Schrô inger que preparasse um coló- 
quio sobre esse tema. Foi a preparação do colóquio que acabou levando Schrôdin- 
ger, poucos meses depois, à formulação da mecânica ondulatória, a sua versão da 
mecânica quântica. 

Schrödinger, que tinha uma excelente formação em física matemática, preocu- 
pou-se logo em encontrar uma equação de ondas para as ondas materiais. de de 
Broglie, começando pelos estados estacionários, ou seja, por partículas de cnergia 
E dada. 

Para partículas livres não-relativísticas isso era bastante simples. Com efeito, 
nesse caso, as relações de de Broglie implicam, como vimos, que à frequência v da 
onda e seu número de onda k = 2m/à estão relacionados com a energia e o mo- 
mento da partícula por 


TE =Av= ño] 
| | 
| (7.59) 
h = 
[PS q Bk | 
ao mesmo tempo que se tem, para uma partícula livre de massa m, 
2 
got. (7.60) 
2m 


(a energia é puramente cinética). 
Por outro lado, a equação de ondas monocromáticas de número de onda k é, 
em três dimensões, 


[erra Es 


ou seja, usando as (7.59) - (7.60), 


ou, finalmente, 
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3 
Za Ay (1)=Ev(s) (7.62) 


que é a eguação de Schrödinger estacionária para partículas livres não-relativísti- 
cas de massa m e energia E. 

Consideremos agora o problema não-relativístico do movimento de uma par- 
tícula de massa m e energia E num campo de forças, associado à energia potencial 
v(x), para o qual 


(7.63) 


O problema do átomo de hidrogênio, p. ex., é desse tipo. 
Para obter a equação das ondas de de Broglie nesse caso, Schrödinger apelou, 
como o próprio de Broglie já fizera, para a analogia ótico-mecânica que havia sido 
descoberta por Hamilton. 
Vimos na Seç. 2.11 que a trajetória de uma partícula de energia E dada num 
campo de forças de energia potencial V(x), segundo as leis da mecânica clá: 


ca, é 
idêntica à de um raio luminoso num meio inomogêneo de índice de refração dado 
pela (2.73), 


In (= q = “O | (7.64) 


ji 


segundo as leis da ótica geométrica. 

Em seu primeiro trabalho de 1926, Schrödinger argumentou: 

“Nossa mecânica clássica é talvez completamente análoga à ótica geométrica, 
e por isto falha e está em desacordo com a realidade ... Portanto é preciso estabelece- 
cer uma mecânica ondulatória, e o método mais óbvio é a elaboração de uma teoria 
ondulatória a partir da analogia Hamiltoniana”. 

Sabemos (Seç. 3.1) que, para ondas de número de onda reduzido ko num meio 
de índice de refração n, o número de onda no meio é k = n ko . Logo, a equação de 
ondas monocromáticas (7.61) deve ser substituída por 


í 


[a + nº (x) a] y @)= 0| (7.65) 


onde ky é o número de onda na ausência do meio, ou seja, para partículas livres, de 
mesma energia (fregiiência), dado, como na (7.61), por 
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(7.66) 
A «JO -ay- 20 yys 2 
Raio h 9 yh)= åy E vt EV 
om seja 
aw+v(O)y= Ev6)| (1.67) 


que é a equação de Schrödinger para estados estacionários de energia E na pre- 
sença da energia potencial V(x), generalização da (7.62). Para o átomo de H, p. 
ex., seria 


(7.68) 


Não basta, entretanto, formular uma equação de ondas. É preciso que saibamos 
como interpretá-la. A que correspondem a amplitude e a intensidade da onda? Qual 
é a relação entre a onda e a partícula a ela associada? 

O problema da interpretação também está relacionado com as condições que 


devem ser impostas às soluções da equação para que sejam fisicamente accitávei: 
s de contorno que devem ser satisfeitas. 


em particular as condiçõ 
Trata-se precisamente de formular os novos conceitos físicos associados à es- 
cala atômica, Esse é um problema altamente não-trivial, e ainda hoje, mais de meio 
século após a formulação da teoria quântica, alguns aspectos mais sutis continuam 
sendo elaborados (seç. 10.8). 
Deixando de seguir a evolução histórica, vamos abordar a formulação dos 
princípios e conceitos básicos da física quântica no próximo capítulo. 


PROBLEMAS 


1. Para verificar se o conceito de fóton é relevante no eletromagnetismo mi- 
croscópico, considere uma estação de rádio que transmite na fregiiência de | MHZ 
e com uma potência total emitida de 5 kW. (a) Calcule o comprimento de onda das 
ondas de rádio emitidas. (b) Calcule a energia correspondente dos fótons, em eV. 
(c) Quantos fótons são emitidos por segundo? 


2. O comprimento de onda correspondente ao limiar para que ocorra o efeito 
fotoelétrico no alumínio é de 2.954Á. (a) Qual é a função de trabalho do Al (em 
eV )? (b) Qual é a energia cinética máxima dos elétrons ejetados do Al por luz 
ultravioleta de comprimento de onda de 1500Å? 


3. Um fóton de 100 MeV colide com um próton em repouso. Calcule a perda 
máxima de energia que o fóton pode sofrer. 


4. Relacione a direção q de desvio do elétron de recuo no efeito Compton 
(Seg. 7.4) com as fregiiências vo e v dos fótons incidente e espalhado e o ângulo 
8 de espalhamento. 


5. Um fóton de raios X de Ào = 3 À é espalhado por um elétron livre em 
repouso, sendo desviado de 90º. Qual é a energia cinética de recuo do elétron (em 
ev)? 


6. Um pósitron de momento p colide com um elétron em repouso, levando o 
par a aniquilar-se em dois fótons, cujas direções de propagação formam um ângulo 
8 uma com a outra. Demonstre que a soma dos comprimentos de onda dos dois 


fótons é igual a À. (1 — cos6), onde À. é o comprimento de onda Compton do 
elétron (observe que o cálculo é semelhante ao do efeito Compton). 


7. Em 1965, Höglund e Mezger observaram, com um radiotelescópio, uma li- 
nha espectral de emissão de frequência 5.009 MHz. (a) Mostre que essa linha cor- 
responde a uma transição entre dois níveis de Rydberg do átomo de hidrogênio, n 
= 110 e n= 109. (b) Qual é o raio da órbita de Bohr n = 110? 


8. Para verificar o possível efeito de correções relativísticas na teoria de Bohr 
do átomo de hidrogênio. pode-se calcular a razão v/c, onde v é a velocidade do 
elétron no estado fundamental do átomo. Mostre que 


o ea 
he | 
onde q é chamada de constante de estrutura fina. Mostre que O = 1/137, de modo 


que v/e < 1%. 


9. No tratamento do modelo de Bohr do átomo de H na Seç. 7.7, o núcleo 
(próton) foi tratado como se tivesse massa infinita em repouso. Na realidade, o 
elétron e o núcleo se movem em torno do centro de massa do sistema. (a) Mostre, 
levando em conta esse efeito, que ele corrige a constante de Rydberg por um fator 
de MAM + m), onde M é a massa do núcleo. (b) Considere o espectro do deutério 
(isótopo do hidrogênio de massa 2). Qual é a variação percentual de comprimento 
de onda entre uma linha do espectro do H e a linha correspondente do espectro do 
deutério? 


10. Considere um oscilador harmônico bidimensional, de energia 


onde r é a distância ao centro e œ a frequência angular do oscilador. Para órbitas 
circulares, aplique a condição de quantização de Bohr e obtenha os níveis de ener- 
gia. Qual seria a frequência da radiação emitida numa transição entre dois níveis 


vizinhos? 


41. Considere uma molécula diatômica formada por dois átomos idênticos de 
massa M (ex.: H.,0s,...) e separação ro. A molécula pode entrar em rotação 
(como um haltere) em torno de um eixo que passa pelo seu centro, perpendicular 
ao segmento que liga os dois átomos, tratado como uma barra rígida. (a) Aplicando 
a condição de quantização de Bohr, calcule os níveis de energia rotacional da mo- 


lécula. (b) Para a molécula de Hz, calcule a encrgia (em eV) do primeiro nível 


rotacional, tomando ro = 0,74. 
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12. Calcule o comprimento de onda de de Broglie associado às seguintes par- 
tículas: (a) elétron de energia igual a 10 MeV (relativística!); (b) nêutron térmico 
(à temperatura T = 300 K). 


13. Tluminando-se sucessivamente a superfície de um metal com luz de dois 
comprimentos de onda diferentes, M e À», encontra-se que as velocidades máximas 
dos fotoelétrons emitidos estão relacionadas por: Vi max = GV; max Demonsire que 
a função de trabalho é dada por 


E fh — A Jhe 
o (0º 1) ad, 


14. Um átomo de hélio uma vez ionizado, He”, tem um espectro análogo ao 
do hidrogênio, mas seu núcleo tem o dobro da carga do de hidrogênio. (a) Desen- 
volva a teoria de Bohr para o He”, calculando os níveis de energia E, em função 
das constantes físicas e, m, €, h, €o (b) Calcule a energia de ionização do He”. 


PRINCÍPIOS 
BÁSICOS DA 
TEORIA QUÂNTICA 


8.1 A dualidade onda—particula 


Vimos ao longo deste curso como as teorias sobre a natureza da luz evo- 
luíram de uma teoria corpuscular, capaz de explicar leis básicas da ótica geomé- 
trica, à teoria ondulatória, que explica os efeitos de interferência e difração da luz. 
s teorias do efeito fotoelétrico e do efeito Compton voltaram a 
apontar para características corpusculares da luz, levando à introdução dos fótons 


como “partículas de luz”. 


Por ouiro lado, 


Para os elétrons, considerados como partículas desde sua descoberta, a confir- 
mação experimental das conjecturas de de Broglie demonstrou efeitos de difração e 
interferência caracteristicamente ondulatórios. 

Como conciliar conceitos tão diferentes como os de onda e partícula? Durante 
o período em que isso estava sendo tentado, William Bragg chegou a descrever a 
situação nestes termos: “Os elétrons se comportam como partículas às segundas, 
quartas e sextas e como ondas às terças, quintas e sábados” Aos domingos, presu- 
mivelmente, os físicos descansariam do esforço de tentar compatibilizar os dois 
comportamentos. 

Procuremos definir de forma mais precisa o contraste entre “comportamento 
ondulatório” e “comportamento corpuscular” analisando o experimento de Young 


de duas fendas (Seçs. 3.1 e 3.2) em termos dos conceitos clássicos de onda e de 
partícula. 


(a) Experimento de Young com ondas clássicas 
Vamos pensar em ondas clássicas como ondas “macroscópicas” num meio: por 
exemplo, ondas de som na atmosfera. As ondas, produzidas por uma fonte suficien- 
temente pequena para que possamos tratá-la como puntiforme (fonte cocrente), in- 
cidem sobre um par de aberturas num anteparo opaco e são detetadas sobre um 
anteparo de observação por um detetor móvel que varre o anteparo (por exemplo, 
um microfone acoplado a um altofalante). 


>], >, > lo 


Fig. 8.1 Experimento de Young com ondas clássicas 


Se apenas a fenda | estivesse aberta, a intensidade do som detetada seria 
I (x) (fig.8.1); analogamente para 2, sendo 


(8.1) 


onde q (x) é a amplitude da onda sonora (função de onda). A experiência de Young 
mostra interferência, ou seja: com 1 e 2 abertas, a intensidade observada é 


=| Oro =n+L+2EL cosa (82) 


onde A é a defasagem entre as duas contribuições [cf. (3.11)]. 

— Logo, em geral, h2 * h + b ; em particular, sc; = b = h , a intensidade 
resultante A» pode variar, de O a 41 (com valor médio 2h), conforme a inter- 
ferência seja destrutiva ou construtiva. 
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— Assim, se fecharmos uma das fendas, a intensidade num ponto x do an- 
teparo de obs 


ção pode diminuir, mas também pode aumentar. 


— Se formos gradualmente diminuindo a intensidade da fonte sonora, as fran- 
jas de interferência vão diminuindo proporcionalmente de intensidade, de forma 


contínua. 


(b) Experimento de Young com partículas clássicas 


P, >P, | > P, 


t i 
| | 


R 
E! 


AININ 


N| 


Fig. 8.2 Experimento de Young com partículas clássicas 


Para simular uma fonte puntiforme, que emite isotropicamente em todas as 
direções, vamos imaginar uma metralhadora giratória F que dispara balas varrendo 
direções ao acaso (supondo também que as balas possam ricochetear, emergindo de 
cada fenda segundo um conjunto de direções). Para simular uma fonte estacionária, 
de intensidade constante, supomos que a taxa de disparos (nº de balas/unidade de 
tempo) é constante. Um detetor D, por exemplo, uma caixa de areia, varre o an- 
teparo de observação e registra a probabilidade P(x) dx de encontrar uma bala 
entre x e x + dx no anteparo (razão do número de balas detetadas neste intervalo, 
por unidade de tempo, à taxa de disparo). 

Sejam P; (9) e P>(x) as distribuições encontradas quando somente 1 ou so- 
mente 2 (respectivamente) está aberta. Supomos que as balas (partículas) não po- 
dem fragmentar-se, ou seja: 

— Não podemos detetar uma fração de bala 

— Cada bala passa ou pela fenda 1 ou pela fenda 2, e esses eventos são inde- 
pendentes e mutuamente exclusivos. Logo, a distribuição Pı2 observada com ambas 
as fendas abertas é 
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OREG (83) 


— Se fecharmos uma das fendas, como P, >0 e P, 2 0, a distribuição 
Pr (x) só pode diminuir, em cada ponto x. 

— Se formos diminuindo a taxa de disparos. as balas continuam chegando 
uma a uma até O anteparo de observação. distribuídas em pontos x ao acaso, apro- 
ximando-se da distribuição (8.3) após um tempo de observação suficientemente 
grande. 


(c) Experimenio de Young com elétrons 
Experimentos do tipo do de Young com partículas atômicas ou subatômicas 
são muito difíceis de realizar. devido à escala, grau de monocromaticidade dos fei- 
xes e outros requisitos necessários. Entretanto, os efeitos a serem descritos já foram 


: 5 p 
observados com elétrons e outros tipos de partículas. 


ima 


Fig. 8.3 Experimento de Young com elétrons 


A fonte F de elétrons pode ser um filamento aquecido. O detetor poderia ser 
um contador Geiger, que contém um gás num campo elétrico próximo ao valor 
disruptivo que produziria uma descarga no gás. A passagem de um elétron, pela 
ionização que gera, provoca um efeito de avalanche. que amplifica o efeito ao nível 


= Com elétrons: C. Jönsson, Z. Phys. 161, 454 (1961); Am J. Phys 42, 4 (1974). 
Com nêutrons frios: A. Zeilinger et al.. Rev. Mod. Phys. 60, 1067 (1988) 
Com átomos: O. Camel e J. Mlynek, Phys. Rev. Let. 66, 2689 (1991). 
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macroscópico, produzindo a descarga (a corrente 
gerar um sinal acústico, por exemplo). 


ociada pode ser usada para 


As características observadas são as seguintes: 

G) O detetor só registra números inteiros de elétrons, nunca uma fração de 
elétron (como para partículas clássicas). 

(li) Para uma fonte de elétrons suficientemente fraca, pode-se fazer com que os 
elétrons cheguem um a um. Nesse caso, eles chegam em pontos x distribuídos ao 
acaso, como no exemplo da metralhadora giratória (partículas clássicas), e pode- 
mos medir a distribuição de probabilidade P;(x) correspondente a ter só a fenda j 
aberta (j = 1,2). bem como a distribuição Pi» (x) com as duas fendas abertas. 

(iii) Acumulando as contagens de uma fonte muito fraca durante um tempo 
longo, obtêm-se (para elétrons suficientemente monoenergéticos) franjas de inter- 


ferência em Piz 


Rh *8+8 | (8.4) 


com uma figura de interferência idêntica à de ondas clássicas. 

(iv) Fechando uma das aberturas, Pi: (x) tanto pode diminuir como aumentar, 
dependendo da posição x (como para ondas clássicas). 

As propriedades (i) e (ii) são características de partículas clássicas, e (iii) e 
(iv) são características de ondas clássicas. A única conclusão possível é: 


Os elétrons (e outras partículas atômicas e subatômicas, inclusive o fóton) 


não são NEM partículas clássicas NEM ondas clássicas (embora mostrem algumas 
das propriedades de ambas); 

Entretanto, o fato notável, que pode ser inferido pela analogia entre a figura de 
interferência dos elétrons e a das ondas sonoras, é que existe uma função de onda 


Y @) tal que, se y(x) é o seu valor quando só a fenda j está aberta, 


Po (0) = u+ y 


Superposição 
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neoios mésicos ca tear 


8.2 A interpretação probabilística 


Identificando W(x) com a função de onda de Schrödinger das ondas de de 
Broglie, a (8.5) implica que a interpretação física de y (x) é como uma amplitude 
de probabilidade, ou seja que 


|e (Jd x 5 wol Fa (8.6) 


é a probabilidade de encontrar a partícula entre x e x + dz (deteção ao longo da 


direção x descrita acima). 
1928 e valeu-lhe o prêmio Nobel em 1954. 


ssa interpretação física foi proposta por Max Born em 


O fato de que amplitudes de probabilidade podem interferir e propagar-se 
como ondas é extremamente peculiar. A interferência encontrada no experimento 
de Young com elétrons, por exemplo, é incompatível com a idéia de que o elétron 


tem de passar pela fenda 1 ou pela fenda 2. 


>P, >P, > Pe 


AEN 


UV 


Fig. 8.4 Observação ca fenda pela qual um elétron passe 


O) —» x 


Para verificar isso diretamente, consideremos uma variante (altamente esque- 
matizada) da experiência descrita, em que procuraremos verificar por qual das fen- 
das o elétron passa. Para isso, iluminaremos as fendas com uma “lâmpada” Z e 
procuraremos observar luz espalhada pelo elétron (fig. 8.4) por ocasião de sua pas- 
sagem. Como partícula carregada, o elétron espalha a luz, e podemos verificar 
(usando um circuito de coincidências) se o “flash” devido à sua passagem provém 
da fenda 1 ou da fenda 2. Para tornar a identificação possível, podemos reduzir a 
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intensidade do feixe de elétrons a um valor tão baixo que passa somente um elétron 
de cada vez. Por outro lado, é preciso que a luz seja suficientemente intensa para 
que tenhamos certeza de que todos os elétrons são observados (são acompanhados 
de “flashes”). 

Se fizermos a experiência nessas condições, verificaremos que os elétrons que 
passam pela fenda 1 têm uma distribuição de probabilidade P; (x) (como seria de se 
esperar). e os que passam por 2 têm P» (x). Todos os “flashes” de luz provêm ou de 
1 ou de 2; nunca se observarão “flashes” vindo ao mesmo tempo de 1 e 2 devidos 
à passagem de um elétron. E quanto vale Py (x)? Como as observações foram feitas 
com as duas fendas abertas e todos os elétrons foram observados, apenas agru- 
pando-se conforme a fenda pela qual passam, será 


[RO= R ORo] (87) 


ou seja. ao observarmos por qual fenda o elétron passa, destruímos a interferência. 
Por conseguinte, a maneira pela qual se faz a observação na escala micros- 
cópica (atômica ou subatômica) pode afetar drasticamente os resultados. 
Na 
mas esta perturbação pode ser levada em conta e pode ser reduzida, em princípio, 


ica clássica, o processo de observação também perturba os resultados, 


a um nível arbitrariamente pequeno. 
No presente exemplo, a perturbação provém do espalhamento de luz pelo elé- 
tron. Não será pi 


mos usar como controles para isso: a intensidade da luz e o seu comprimento de 


ível também reduzir o seu efeito? Há dois parâmetros que pode- 


onda (suponda-a monocromática). Classicamente, diminuir a intensidade eguivale- 
ria a diminuir a interação com os elétrons. Entretanto, a dualidade onda-partícula 
também se aplica à luz: ela é formada de fótons, e reduzir a intensidade equivale a 
diminuir o n.º de fótons incidenies por unidade de tempo e de área, sem alterar a 
interação de cada fóton com o elétron. 

O resultado” é então que diminui a probabilidade de que o elétron encontre 
um fóton ao passar, ou seja, a probabilidade de espalhamento torna-se < 1 (antes, 
supúnhamos que era = 1 : havia um fóton espalhado na passagem de cada elétron). 


* Um experimento equivalente a este foi realizado por X. Y. Zou, L. J. Wang e L. Mandel, Phys. Rev. Lett. 
67,318 (1991), para fótons, c por E. Burks er al., Nature 391, 87] (1998), para elétrons. 
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Haverá então dois tipos de elétrons nas observações: os de “tipo A”, cuja de- 
tecção está associada à observação de um fóton espalhado [com probabilidade 
P, (x) para os que passam por 1 e P» (x) por 2], e os de “tipo B”, que foram detec- 
tados sem espalhamento de luz associado, de forma que não podemos dizer se pas- 
saram por 1 ou por 2. 

Para os elétrons de tipo A, a distribuição de probabilidade continua sendo da- 
da pela (8.7). Entretanto, para os elétrons do tipo B, aparece o termo de interferên- 
cia, ou seja, só interferem as amplitudes de probabilidade associadas aos elétrons 
para os quais não se pode determinar por que fenda passaram. 

Podemos porém reduzir a perturbação devida ao espalhamento de luz. man- 
tendo a sua intensidade suficientemente elevada para garantir que todos os elétrons 
que passam dão origem a um “flash” de luz espalhada. Basta para isso diminuir a 
energia de cada fóton, o que, pela relação de Einstein E = Av. equivale a diminuir 
v, OU seja. aumentar o comprimento de onda À da luz. 

Verifica-se então que, para À suficientemente grande, reaparecem os efeitos de 


interferência, mesmo com luz de intensidade elevada: 


isto acontece quando À é da 
ordem da distância d entre as duas fendas. Mas, devido às propriedades ondula- 
tórias da luz (poder separador), não podemos localizar uma partícula, usando luz 
de comprimento de onda À, com precisão melhor do que À. Logo, nessa situação, 
não podemos mais saber se a luz espalhada provém da fenda 1 ou da fenda 2! 

O resultado dessa “conspiração da Natureza” é que amplitudes de probabili- 
dade associadas a duas possibilidades diferentes (fenda 1 ou fenda 2) interferem 
quando não é possível saber qual das duas foi seguida, e não interferem quando é 
possível distinguilas. Caminhos indistinguíveis interferem. 

Vemos assim que, na escala quântica. o processo de observação pode ter uma 
influência decisiva no resultado observado. Conforme foi observado por Dirac, isso 
permite definir, pela primeira vez na física, uma escala absoluta de tamanho, em 
que “grande” e “pequeno” deixam de ser apenas conceitos relativos. A escala atô- 
mica e subatômica é pequena no sentido absoluto de que nela se encontram limi- 
tações absolutas às possibilidades de observação: neste sentido, os objetos atô- 


mico: 


ão “frágeis”, e é preciso sempre especificar de que forma estão sendo 
observados. 

A medida dessa escala é introduzida através da constante de Planck k: uma 
ação é “grande” quando é >> A, condição necessária para que nos aproximemos do 
nível macroscópico. 
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Poderíamos perguntar. por exemplo, por que não se observam interferências de 
Young com balas de metralhadora (Seç. 8.1(b)), uma vez que estas também devem 
ser descritíveis pela física quântica 

Teríamos de admitir, para começar, que é possível criar um feixe monoener- 
gético de balas, todas com a mesma velocidade v. Qual seria o comprimento de 


onda de de Broglie correspondente? Se tomarmos m = 10 g e v = 500 m/s 


h 6,63 x 10 


A =— zm ~ 13x 10/m 
x 5 x 10º 


mv 10 


de modo que as oscilaçoes da figura de interferência — se fosse concebível pro- 
duzi-las — ocorreriam numa escala totalmente inacessível à resolução de qualquer 
detetor imaginável, sendo pois inobserváveis. 

Outro fator que contribui para a não-observação de interferências ao nível ma- 
croscópico (o efeito conhecido como “descoerência”) será discutido na Seg. 10.8. 


8.3 Estados de polarização da luz 


Para introduzir os conceitos e os princípios básicos da teoria quântica, um 
exemplo particularmente adequado, pela sua simplicidade, é o da polarização da 
l 
em termos de um pequeno número de variáveis; a descrição quântica será também 


A razão disso é que, classicamente, a polarização de um feixe pode ser descrita 


então bem mais simples do que a da posição de uma partícula, que pode assumir 
uma infinidade contínua de valores. 


Classicamente, como vimos na Seç. 5. 3, o estado de polarização de uma onda 


plana monocromática de intensidade e direção de propagação dadas fica determi- 
nado por dois parâmetros: a razão b/a das amplitudes do campo elétrico em duas 
direções ortogonais (num plano L à direção de propagação) e a defasagem ô entre 


essas componentes [ef. (5.29)] 


Procuraremos descrever quanticamente apenas a polarização dos fótons, sem 
nos preocuparmos com sua energia (fregúência) e direção de propagação (ou seja, 
com a dependência de x e z). Vamos considerar primeiro estados de polarização 


linear. 


Vimos na Seç. 5.8 o conceito de um filtro de polarização. Um filtro de polari- 
zação linear, usado como polari 


ador, só deixa passar luz de polarização linear 


numa dada direção (eixo do filtro). Se to- 
marmos a direção de propagação como 
[sz eixo z, a direção de polarização lincar 
| i Z7 produzida pelo filtro pode ser caracteri- 


A | R zada pelo ângulo 6 que faz com uma di- 
ai reção fixa no plano transversal, por exem- 
plo, a direção x (fig. 8.5). 
Analisador Podemos usar um filtro idêntico como a- 
nalisador, para detetar a polarização. Se 
Polarizador o eixo do analisador forma um ângulo 


i . q com a direção de referência x, ele só 
Fig. 8.5 Filtros de polarização linear ig z É 

deixará passar uma fração F/y da inten- 
sidade da luz proveniente do polarizador, onde 1/1, para um filtro ideal, é dado 


pela lei de Malus (5.82): 
>>> 

Iíh=cs(0-q), (8.8) 
| 


Passará toda a intensidade se os eixos estão alinhados (6 = q), e ela será toda 
bloqueada se estiverem cruzados (0 — q = +772). 

Como descrever esses resultados em termos de fótons? A polarização linear 
define a direção de oscilação do campo elétrico. No efeito fotoelétrico, é o campo 
elétrico que atua sobre os elétrons: com luz linearmente polarizada, a direção de 
polarização é a direção preferencial em que os elétrons são ejetados. Há evidência 
experimental de que isso vale para cada fóton incidente, ou seja, num feixe de luz 
linearmente polarizado, cada fóton tem a mesma polarização linear. 

Sabemos que a intensidade do feixe é proporcional ao número de fótons. Lo- 
go, a (8.8) deve representar a fração do número de fótons incidente sobre o anali- 
sador que é transmitida por ele. Mas o que acontece com cada fóton incidente? 

Não pode ser transmitida uma fração de fóton: ou ele passa ou não passa. 
Logo, a única forma de interpretar a lei de Malus (8.8) é que ela dá a probabili- 
dude de que um fóton linearmente polarizado na direção O atravesse um analisador 


com seu eixo alinhado na direção q. 


Vimos na Seç. 2.2 que um problema semelhante existe na interpretação cor- 
puscular da existência de reflexão e transmissão parciais na interface entre dois 
meios: um corpúsculo que atinge a interface é refletido ou transmitido? (foi para 
resolver este problema que Newton propôs seu modelo dos “acessos” de fácil re- 


flexão ou fácil transmissão). 
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8.4 Vetores d 


Classicamente, dizemos que um sistema se encontra num estado bem definido 
quando conhecemos a máxima informução possível a seu respeito: por exemplo, 
para uma partícula de massa m, o estado clássico é definido pela posição x e velo- 
cidade v (ou momento p = m V) 

No mesmo sentido, diremos que o estado quântico de polarização de um fóton 
fica bem definido quando sabemos que ele é linearmente polarizado numa dada 
direção (8 ou q, porexemplo). Podemos dizer então que o polarizador, na expe- 
riência acima descrita, prepara fótons no estado de polarização linear 0, c que, 
após atravessar o analisador, um fóton estará no estado de polarização linear q. 

Chegamos assim à seguinte conclusão: a probabilidade de que um fóton pre- 
parado no estado de polarização linear O passe por um analisador que seleciona 
fótons de polarização linear q é 


| pl (8.9) 


Não é possível predizer com certeza o que acontece com um fóton, exceto para 
q = 9, quando P = 1, e para ọ = O +7/2, quando P = 0. 

Podemos tomar então como amplitude de probabilidade associada a esse pro- 
cesso 


| cos (-9) = cos0 cos q + sen Fsi 9 


o que também pode ser escrito como um produto de fatores associados a O e 
P separadamente (ou seja, aos estados de polarização do fóton incidente e do fóton 
transmitido), da seguinte forma: 


| cos @ — p) = (cos q sen q) fe (8.10) 


sen ð) 


onde estamos usando álgebra de matrizes para a multiplicação de uma matriz linha 


cos 6) 


(cosp senq) por uma matriz coluna f- 
senQ J 


8.4 Vetores de estado 


Sabemos pela álgebra linear que uma matriz coluna pode ser considerada co- 


mo um vetor num espaço vetorial linear; para uma matriz de dois elementos, este 
espaço tem dimensão = 2, e um estado geral de polarização linear é então repre- 
sentado pelo vetor coluna 


cla teo! 


=1 (8.11) 


onde esta última condição, chamada de condição de normali. 
neste caso ao fato de que tem de ser P(80,0) = 1 icf. (8.9)]. 


dão, corresponde 


Veremos logo que essa representação se aplica não só à polarização linear, 
mas a qualquer estado de polarização (no caso geral, elíptica) do fóton. Entretanto. 
para representar o caso geral, é necessário que c; e cz possam tomar valores com- 
plexos. 

Com efeito, vimos que o estado geral de polarização depende de dois parâ- 
metros reais. Se c; e cz são complexos, temos à disposição 4 parâmetros reais, mas 
que têm de obedecer ao vínculo de normalização, deixando 3 parâmetros reais li- 
vres. Mas, se multiplicarmos cı e c, por um fator de fase arbitrário e, isto não 
altera as probabilidades, que correspondem a módulos ao quadrado de amplitudes 
de probabilidade: logo. a fase absoluta de cı € 
se altere a diferença de fase entre ess 


pode ser alterada, desde que não 


s dois números complexos [como na onda 
clássica (5.29)]. Sobram então precisamente dois parâmetros reais arbitrários, con- 
firmando a necessidade de cy e «» serem complexos para descrever polarização 
geral. 

Vamos utilizar uma notação devida a Dirac pata representar o vetor coluna 
associado à polarização linear 8: 


DE a (8.12) 


sen 9 


que chamaremos de vetor de estado correspondente a essa polarização. O vetor 
linha da (8.10) será representado por 


(ọ| = (cospseng) (8.13) 
com 
|8) = (cos psen q) We cos (8 — q) (8.14) 
d sen 8 
correspondendo ao produto escaiar desses dois vetores. Dirac chama |...) de “ket” 
e (...I de “bra”; o produto escalar (...l...) é então um “ bracket” (colchete de 


Dirac) c a (8.9) se escreve 
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(8.15) 


P(9.9)= fojo)| 
No caso geral, em que as componentes têm de ser complexas, o vetor linha asso- 


ciado ao vetor coluna (8.11) é definido por: 
(8.16) 


(8.17) 


| = a b, + a b, 


ZADRA 


Em particular, a norma || | c) Il é definida como 
(8.18) 


É + 


of = l9- 


| 


que tem de ser = 1 pela (8.11). Se (alb) = 0, diz-se que la) e lb) são orto- 


gonais. 
Chegamos assim à seguinte regra básica: 


Regra I: O estado quântico de polarização de um fóton (de luz 


i 

| $ 

| monocromática, numa dada direção de propagação) é representado 
pelo vetor de estado normalizado 

é; PATÊ 
) sam pio 


to=[8 


(8.19) | 


Não-unicidade da representação 
A representação ndo é unívoca, Por exemplo, o vetor de estado de polarização 


linear na direção O pode ser representado igualmente por 


A norma tem de ser real c não-negativa, o que requer a conjugação complexa na (8.16). 
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(8.20) 


Com efeito, isso dá 


+ jeen + eta] sa-a) (821) 


que é o mesmo resultado (8.20), preservando a normalização c a probabilidade 
(8.9). Podemos também multiplicar ambas as componentes por um mesmo fator de 
fase arbitrário, como vimos. As diferentes representações correspondem ao mesmo 
vetor de estado, da mesma forma que o mesmo vetor é representado por componen- 
tes diferentes em diferentes sistemas de coordenadas (Seç. 8.7). 


8.5 Observação binária. Polarização cireular 


Ao fazer um fóton passar por um analisador com eixo orientado na direção 
q estamos observando a polarização linear do fóton nessa direção. (i) Essa obser- 
vação só tem dois resultados possíveis: o fóton passa (“sim”) ou não passa (“nã 
que podemos codificar, em linguagem binária, por 1 (“sim”) ou O (“não”). Além 


disto, (ii) só existe um estado para o qual o resultado é, com certeza “sim”: o 


estado Ig). Uma observação que satisfaz às condições (i) e (ii) será chamada de 
“observação binária”. 

Para um fóton preparado num estado de polarização qualquer, só podemos, em 
geral, predizer a probabilidade de que passe pelo analisador, e inferimos da (8.15) 


a segunda regra básica: 


| Regra II: Se um fóton é preparado num estado de polarização la), a | 


| probabilidade de que seja observado com polarização | b) numa obser- 
vação binária imediatamente posterior é 


mma 


Em particular, isso dá a justificativa geral da condição de normalização, pois 
P(a,a) tem de ser = 1. 


Para que a (8.22) possa representar uma probabilidade, seu valor tem de estar 
entre 0 e 1, o que decorre da bem conhecida desigualdade de Schwarz (Probl. 8.1): 


(8.23) 


Luz circularmente polarizada 


Resulta da representação da Seç. 5.3 de luz circularmente polarizada que a 
intensidade de um feixe circularmenie polarizado, ao passar por um analisador de 
direção q, sempre se reduz à metade, qualquer que seja q, ou seja. a probabilidade 
de passagem de nm fóton cirenlarmente polarizado é = 1, independente de q. 


D 
Logo, se representarmos o vetor de estado correspondente por lc) = ke i a 
(8.22) dá ý 


1 = Plc) = Kolo? 


craol] 


= [osọ a +seng of = Coso q +seng ó) foso G +senq a) 


ou seja, 


Vo (824) 


cos? q if + (Qi +a ) cos q sen q + sen*q |c;| 


Em particular, tomando q = 0 e q = > + obtemos 


Dei 
Ig =—=e 
1d 
2 iB 


=é 


t A2 


T 
e, tomando Q = T’ 
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08) 4 6768) | = cos («-B)=0 


r pH A P s 
o que dá B = a + z (mod. 27). Escolhendo convenientemente o fator de fase arbi- 
trário, temos portanto duas soluções possíveis: 


| =() 


que correspondem às duas polarizações circulares independentes (esquerda e direi- 
ta; cf, fig. 5.2). 


(8.25) 


8.6 Observáv 


Que grandezas são observáveis na física quântica? Uma grandeza que pode ser 
medida, como a polarização linear de um fóton numa dada direção, é observável, 
mas o resultado de uma medida não precisa ser “sim” ou “ não”, como numa ob- 
servação binária. A energia de um fóton, por exemplo, é uma grandeza observável, 
e o resultado pode ser qualquer número real >0. Por outro lado, é condição ne- 
cessária de observabilidade que o resultado da observação seja um número real. 

Vamo-nos limitar, por enquanto, a grandezas A que só podem tomar um nú- 
mero finito de valores, ou seja, tais que os resultados da observação de A só podem 
«ân. Vamos supor também, de início, que existe um e 
um só estado quântico le;) para o qual A toma o'valor a; j=1,2,..,n). 

o binária que responde à pergunta: 


ser Os números reais aj. d2, 


Podemos então definir como Ej; a observ: 


Ee O valor de A no estado le;) é a? 

Para ver que se trata de uma observação binária, basta notar que só há duas 
respostas possíveis: “sim”, se j = k, e “nã 
para o qual a'resposta é “sim”. 


para ják, e só existe um estado, | e;), 


Logo, pela regra I, se um fóton for preparado no estado | e;), a probabilidade 
de que a medida de A produza o resultado a; (portanto, que o fóton seja observado 
no estado le;)) é 


a GRJ- Lea (8.26) 


onde 84 = 1 (j = k), = O(j # k). 
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86 Ob 


Escolhendo convenientemente as fases dos vetores de estado, a (8.26) se reduz a 


K 


eler) iea (8.27) 


o que significa que [21) , lez), len) formam um conjunto ortonormal de n ve- 
tores de estado. 

Sabemos, porém, da álgebra linear, que, num espaço vetorial de dimensão m, 
não podem existir mais de m vetores ortonormais. Vimos também que m = 2 para 
os vetores de estado associados à polarização do fóton, 

Logo, no conjunto de estados quânticos associados à polarização do fóton, 


nenhuma grandeza observável (ou seja, que só dependa da polarização), pode tomar 
mais do que 2 valores diferentes: a dimensão do espaço dos estados representa o 


número máximo de valores que uma grandeza observável nesse espaço pode tomar. 


Exemplo 


= 
<— 
| ] Feixe 
Cristal de incidente 
calcita arbitrário 


Fig. 8.6 Dupla refração 


Quando um feixe de luz qualquer incide sobre um cristal de calcita (Ca CO3) ta- 
lhado de forma conveniente, dá origem a dois feixes transmitidos (feixe ordinário e 
feixe extraordinário), que têm polarizações lineares ortogonais (fig. 8.6). Nenhum 
material produz mais de dois feixes associados a polarizações diferentes, o que é 
consistente com termos tomado n = 2 para descrever o estado quântico de polari- 
zação de um fóton. 


Valores médios 
Num estado de polarização |u} qualquer do fóton, a grandeza A não 
tomará em geral um valor definido: isso só acontece nos estados | e;). No caso 


em cada observação, 


geral, A tomará um de seus dois valores possíveis, a; ou a: 
ades pı e pz dadas pela Regra II (generalizada) para cada um 


e haverá proba: 


desses valores: 
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(8.28) 


Assim, se fizermos um número N muito grande de observações de A no estado lu), e 
obtivermos o resultado a; em m delas € æ nas m restantes, com n; + m = N , as 
fregiiências relativas m/N e m/N se aproximarão respectivamente de pı e pz à 
medida que N for crescendo. 

Conforme a definição usual, o valor médio (também chamado de valor es- 
perado) de A no estado |u) é então a média ponderada 


(8.29) 


(8.30) 


Voltando à definição (8.17) do produto escalar, temos: 


(al) = mb? rat; = (a a) (e) 


a 


o que equivale a 


de forma que a (8.30) se escreve: 


(8.32) 


Produto externo 


Vamos introduzir a nova notação la) (bl (produto externo de la) e (b1), 
definida por sua atuação sobre um ket lu) qualquer: 


(e) Ju) = (b]u) |a) | (8.33) 


é o produto do número (blu) pelo ket la). Logo, atuando sobre um ket lu), o 
resultado é outro ket: la)(b| é um operador sobre kets, e é imediato que é um 
operador linear: 


(aXe) (elx) + BI) = la) + B(b|v)) ja) (8.34) 


É fd) 
dı | 
Em termos das componentes la} = | e lb> = (o + o produto externo es- 
» v a 2 
tá associado a uma matriz 2 x 2: 


(8.35) 


o que corresponde à relação bem conhecida entre operadores lineares e matrizes, 
em termos de álgebra vetorial, e satisfaz a (8.33) (verifique!) 
Voltando à (8.32), vemos então que ela pode scr reescrita como 


A, = fáju) (8.36) 


onde À é o operador lincar (o circunflexo é a notação para operador) 


(Rio, | (837) 
com 


E: (8.38) 


8.7 Representações. Matrizes 


Antes de formular regras relativas a observáveis, vamos recapitular alguns re- 
sultados de álgebra linear sobre a representação de operadores lineares por ma- 
trizes e introduzir alguns desenvolvimentos da notação de Dirac. 
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Como o espaço dos vetores de estado de polarização do fóton tem dimensão 2, 


podemos introduzir nele uma base ortonormal le; ), e»), onde 


(8.39) 


e representar qualquer vetor de estado |c > como superposição dos vetores da base: 


Jo = ala) + ele 


(8.40) 


) 
(e| o) 


onde cı € cz são as componentes do vetor coluna 


| lo) (5 | (841) 


ja -alse | 


Em particular, 


o) 
e)= (1) (8.42) 


cosg) 
en j 


polarização linear na direção 6, os estados (8 42) correspondem a 8 = 0 e 


Exemplo 1: Na representação em que 19) = corresponde ao estado de 


9 = 7/2 , respectivamente, e qualquer outro estado de polarização é uma super- 
posição destas duas polarizações ortogonais, onde as componentes 
ci = cos0 e c = sen9, pela (8.40), 


(8.43) 


representam as amplitudes de probabilidade, no estado 16 >, de detetar o fóton com 


polarização linear na direção O ou 3, respectivamente. 


Exemplo 2: É fácil ver (verifique!) que os vetores de estado de polarização 
circular (8.25) são ortogonai: 
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de modo que formam outra base ortonormal para a polarização: fisicamente, qual- 
quer estado de polarização pode ser representado como superposição de polariza- 
ções circulares direita e esquerda. Em particular, 


(8.45) 
onde 
1 cos6) ef 
a =(H0)=—=([ -i = 
astle t Dm) E 
(8.46) 
1 cos 6 ef 
> = {|8} = — E 
és CD Dao E 
4 Lfe i s aiai 
o que dá |0) == » que é a (8.20). Logo, a multiplicidade de repre- 


v2 et 
sentações dos vetores de estado corresponde à multiplicidade de escolhas de bases 
possíveis, exatamente como a de escolhas de sistemas de coordenadas para vetores 
em três dimensões. 

A decomposição (8.45) é um caso particular, para luz linearmente polarizada, 
da representação de um estado geral de polarização como superposição de luz cir- 
cularmente polarizada direita com polarização circular esquerda. A interpretação 
quântica em termos de fótons, porém, é que lc; P = 1 = ef dão as probabilida- 
des de detetar o fóton linearmente polarizado, respectivamente, como fóton circu- 


larmente polarizado dircito ou esquerdo. Fisicamente, isto pode ser realizado com o 
auxílio de cristais que têm a propriedade de birrefringência circular, decompondo 
luz incidente sobre eles em dois feixes, um de polarização circular direita e outro 
esquerda. 


Operador de projeção 
A (8.40) permite escrever a identidade 


|9=talola+te ld 


e) 


à "E (8.47) 
=I, le +IL |ġ 


(8.48) 


Temos 


G= 13] i gan 


A 

ou seja. II; |c) representa a componente do estado lc) associada ao estado le;) da 

base (por exemplo, componente do estado 19) que tem polarização |+) ). Diz-se 
IN A 

que II, Ie) é a projeção de |c) sobre o estado |e;), e LI; chama-se um operador 


de projeção. 


Para um vetor em 3 dimensões, a fig. 8.7 
mostra que 


Hy Ô v= (v ee 


Fig. 87 Projeção de um veior 


é a componente de v na direção E. obtida projetando v sobre essa direção, o que 
justifica o nome de operador de projeção dado a II. 


A (8.47) mostra que 


ai (8.50) 


onde Î é o operador identidade: À le> = lc>, para qualquer vetor lc> . À te- 
lação (8.50) exprime o caráter completo da base le; >, le2>, ou seja, que qualquer 
vetor pode ser representado em termos dela. 

As (8.35) e (8.42) dão a representação matricial dos operadores de projeção e 
da (8.50): 


A 1 ro 

KH, = 10)= | 
oL ) (a E T | 

A+ =| )-1| (8.51) 


wok) 


Matrizes 


Dado um operador linear À, a (8.50) permite escrever a identidade 


ES EloXe lá oe 


(8.52) 


onde 


(8.53) 


chama-se elemento de matriz do operador À entre os estados le;) e le;) (para i = 
j. são os elementos diagonais) 


lexel=(9)09=(50) 


matriz em que só o elemento 12 é + 0 (e = 1). Logo, a (8.53) permite interpretar 
A:j como o elemento (ij) de uma matriz que representa o operador À, da mesma 
forma que (E emma lc>. 

C2 


Temos , por exemplo, 


| Ã= | (8.54) 


Usando a (8.52), vemos que, para qualquer vetor de estado lc >, 
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2 2 
l= âld = $ As (so) la)= DS Apele) (8.55) 
E 


TEL 
5 


o que equivale a 


(8.56) 


a ud ; c 
que é o resultado da aplicação da matriz IlA;jIl ao vetor coluna :) segundo a 
c2 


Alo = [Pote fa) fa artat) (8.57) 
am Aa) a) da + Aco), 


A 
Analogamente, aplicando sucessivamente dois operadores lineares B e Â a um 
vetor Ic), o resultado equivale (Probl. 8.6) à regra do produto: 


(a 8) =D As Ba | (8.58) 


Conjugado hermiteano 
A matriz 


As (8.59) 


1l 
ps 
> > 
E 


que se obtém da (8.54) transpondo linhas e colunas e tomando o complexo conju- 
gado, chama-se marriz conjugada hermizeana de ILA;; ||, e o operador linear Â* cor- 
respondente chama-se conjugado hermiteano do operador À. 


Temos catão, por definição, 


(8.60) 


o que, usando a decomposição (8.40), se estende a qualquer par de vetores la) e Ib}: 
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= (blÃa) | (8.61) 


(lâle) 


Por outro lado, se 


dadas O PT 


c 
temos 
į Lea Er sos ne pt * 2% 
tel= (a é) = (Bu bi + Bob, Bub + Bo 5) 
e [He a 
TOR 
Bo By 
ou seja 


o) = 818) = tel = lê | (8.52) 
e, aplicando a (8.61) a (alÃlc)”, obtemos 


jd 


(8.63) 


Um operador À tal que 


(8.64) 


chama-se operador hermiteano. 
Note as inversões de ordem nas (8.61) a (8.63). 
8.8 Regras para observáveis 


Voltando agora à (8.36), que dá o valor médio (esperado) de um observável A 
num estado quântico de polarização arbitrário, vemos que ele é o elemento de ma- 
triz diagonal de um operador linear À associado a 4, dado pela (8.37): 


(A, = lâle] 


ásicos də teoria gudi 


Como o valor médio de uma grandeza observável é necessariamente um núme- 
ro real, devemos ter 


(lâu) 


uÂ a) = (ulâfu), v la) (8:69) 


o que implica 


(8.66) 


e leva à regra 


| Regra Tla: Uma grandeza observável A é representada por um opera-| 
| dor hermiteano À. | 


Na Seç. 8.6, À foi representado em termos dos dois valores possíveis que pode 


tomar, q e a , e dos vetores de estado (únicos) le;) e lez) a eles associados, por 


Icf. (8.37)] 
E 
å- 9; [aXe] (8.67) 
IL 


onde, como vimos, le;) e [e,) formam uma base ortonormal, e ú, são os opera- 
dores de projeção sobre os vetores da base. 
A (8.67) dá, como (ejle;) = dj 


| â la) = ala) € =12) (8.68) 


o que se exprime dizendo que le) é um AUTOVETOR de À associado ao AUTO- 
VALOR as. Isso leva às regras: 


Regra IIb: Os resultados possíveis das observações de A são os auto- 


| 
valores de À. | 
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| Regra Te: Os estados (de polarização) para os quais A assume com 
| certeza (probabilidade = 1) seus valores possíveis (an, a2) são os aw- | 


| toveiores (também chamados de auioestados) correspondentes de Â. | 


Para que essa interpretação seja aceitável, é necessário que os autovalores se- 
jam reais. Isso decorre do teorema: Os autovalores de um operador hermiteano são 
sempre reais. 


A demonstração é imediata: 


Âj =j} = elil 


juntamente com a (8.65). 
Finalmente, a (8.36) dá a 


| Regra IIId: O valor esperado (médio) de A num estado qualquer lu> é | 

| dado por 

| 

| (a, = lâle) (8.69) 
{ 


Levando em conta a (8.51), vemos também que a decomposição (8.37) 
equivale a 


L 


J (8.70) 


0 q 


ou seja, na base de seus autoestados, a matriz À é diagonal, e seus elementos 


diagonais são os autovalores. 


Exemplo: Observável POLARIZAÇÃO LINEAR 
Sabemos que é possível observar a polarização linear de um fóton numa di- 
reção 0, fazendo-o passar através de um analisador com eixo orientado nessa di- 


r 


ão, e que se trata de uma observação binária: no estado 18), o fóton passa com 


certeza (autovalor 1), e no estado 10 +7) não passa com certeza (autovalor 0). 


Logo, pela (8.38), esperamos que o observável É = polarização linear do fóton 


na direção B seja representado por 
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r> 


e da 
= loxol + 0x [o + 2V0 
t A 


2 
(8.71) 
(cos6 
= [00] = (t0s6 sen0) [288] 
sen 6) 
o que leva a 
z cos” 8 cos6 o | (8.72) 
cos6 sen 6 sen” 6 
que é claramente uma matriz hermitcana (regra Illa). 
Seus autovalores são dados por 
q) G 
akk 
& e 
o que dá 
(cos 0-— a) q+ (cose sen 8) G=0 
(coso sen 8) G+ (sen? g= à) G=0 
Para que haja solução não trivial, devemos ter 
(ua A 
[cos 0-2 cos 8 sen O 
y 
=0 (8.73) 
cos® sen O (sen? p= x) 
que se chama a equação secular, e leva a (verifique!) 
R-1=0 {ù= (0) (8.74) 


conforme previsto (regra HIb). 
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Substituindo no sistema de equações lineares, resultam os autoestados correspon- 
dentes (Regra Tc) 


PO 
e 
D 


Finalmente, o valor esperado da polarização linear na direção O para um estado 
lọ> é [cf.(8.71)], pela Regra Id, 


Ilelâlo) = (oloolo) =|(olo)[ = cos? (9-0)] (8.16) 


o que concorda com o resultado obtido anteriormente. 


8.9 Momento angular de fóten 


Que grandezas são observáveis na física quântica? Essa não é uma questão 
fácil de responder, uma vez que estamos lidando com propriedades de objetos da 
escala atômica, em muitos casos. 

Entretanto, o Princípio de Correspondência, que já vimos na formulação de 
Bohr, pode sugerir pelo menos candidatos a grandezas observáveis. Com efeito, um 
objeto macroscópico é um agregado de objetos microscópicos, e deve ser possível 
extrapolar ao domínio quântico determinadas propriedades dos objetos macroscópi- 
cos, como fizemos para a polarização de fótons. 

Isso se aplica pelo menos a grandezas aditivas, cujo valor para um sistema de 
partículas é a resultante dos valores associados a cada partícula. Exemplos de tais 
grandezas são o momento linear, o momento angular e a energia de sistemas sem 
interações entre as partículas. A “posição de um sistema 


definida em termos do 
seu centro de massa, é também uma “variável coletiva”, combinação das posições 
das partículas. 


Vamos empregar essa idéia para procurar definir um observável quântico cor- 


respondente ao momento angular de um fóton. Na eletrodinâmica clássica, já se 
verifica que um feixe de luz pode transportar não só momento linear, mas também 
momento angular. Da mesma forma que a radiação pode transmitir momento linear 
a um corpo macroscópico (pressão da radiação), pode também transmitir momento 


angular. 
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Isso foi verificado experimentalmente por R. Beth em 1936. Fazendo luz cir- 
cularmente polarizada atravessar uma lâmina de um cristal birrefringente, que 
modifica seu estado de polarização, cle verificou que a lâmina, absorvendo energia 
da luz, entra em rotação em torno da direção de propagação da luz; a transferência 
de momento angular pode ser medida. 

Vamos ver como esse efeito pode ser descrito em termos da teoria clássica. A 
interação da luz com a matéria, classicamente, é descrita pela teoria da dispersão. 
O campo elétrico da onda, de fregiiência angular q, coloca em oscilação forçada 
os elétrons atômicos, que são tratados classicamente como osciladores harmônicos 
de massa m, freglência própria qn e constante de amortecimento y associada à ab- 
sorção de energia da onda. Assim, tomando eixo z na direção de propagação da 


unda, as equações dc movimento para um clétron atômico são: 


carga do elétron 


n(r+v5+08 =)= 


m(54 y5 + 0; >) =cE, | (8.17) 
é + DR agi ARA 


Pela (5.37), o campo elétrico da onda circularmente polarizada é tal que 
E -viE, = Eye (8.78) 


de modo que, definindo 
ja R19) 


as (8.77) dão 


(8.80) 


Procuremos a solução como oscilação forçada sob a forma (8.79), onde 


8 = + (w1 -— 8) (8.81) 
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Vem, com de, = fo; 
dt 
Co” tivo+ o)ra ed cE Ea ga 
m 
o que dá 
E E)/ 
part =. Cara (8.82) 
9-0 tivo 


permitindo calcular r e 8; devido ao amortecimento, será 8 + 0. 


A fig. 8.8 ilustra o resultado para luz es- 
querda e œ <œ (8 > 0): o elétron des- 
creve um movimento circular uniforme 
forçado, acompanhando o campo com 
uma defasagem 8: o campo tem .. uma 
componente Es + O tangencial à trajetó- 
ria do elétron, que produz um torque, re- 
alizando trabalho sobre ele e transferin- 
do-lhe momento angular. 


Fig. 8.8 Oscilação forçada do elétron 


A energia transferida pela onda por unidade de tempo (potência) é dada por 
(para um elétron) 


TY SP. v=e(@+vxB)-v=cE-v (8.83) 
t 


(o campo B não contribui) 


onde 


dW 
vaer- R ARE (8.84) 


r-en =T (8.85) 
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onde T, é a componente do torque (exercido pela onda) ao longo do eixo de ro- 
tação, que pela dinâmica das rotações, está relacionada com a taxa dJ./d!t de va- 
riação do momenio angular do elétron em torno do eixo de rotação por 


aJ: 
des. (8.86) 
dt 
Finalmente, as (8.84) e (8.86) dão 
| aw dl | + larização circul d: 
| ara polarização circular esquerda 7 
[ER o go | Sea a s (8-87) 
| t di | — para polarização circular direita 


notando que o sinal de q) teria de ser trocado para polarização circular direita. 

Vamos agora usar o Princípio de Correspondência para interpretar essa relação 
em termos de fótons. No /imite clássico, o feixe incidente é composto de um gran- 
de número N de fótons de energia E = A, de forma que 


(8.88) 


onde dN / dt é a taxa de absorção de fótons pelo material, por unidade de tempo 
(que coloca a lâmina em rotação, no experimento de Beth). 


Se admitirmos que cada fóton absorvido transfere um momento angular 


o elétron, ou seja que J, é o momento angular do fóton ao longo de sua direção de 
propagação z, teremos analogamente à (8.88), 


las, an | 
m Waa | (8.89) 


Levando as (8.88) e (8.89) na (8.87), resulta 


- + para polarização circular esquerda 
[J =Łħ | (8.90) 


— para polarização circular direita 


e incerteza 315 


ou seja, o momento angular do fóton ao longo de sua direção de propagação é 
quantizado, assumindo os valores +7 ou — F: estes são seus autovalores. (Compare 
com a condição de quantização de Bohr na Seç. 7.7) 

Associando o autovetor |+) da (8.25) à polarização circular esquerda e |-) à 
direita, podemos então construir o observável J, usando a (8.37): 


E ) | (8.91) 


(Representação matricial na base dos estados de polarização lincar 10 = 0),10 = a >. 


8.10 Relação de incerteza 


Na física clássica, quando um sistema se encontra num estado bem definido, o 
resultado de cada observação feita sobre o sistema é bem definido. Como sabe- 
mos, isso não é verdade na física quântica: em geral, só é possível predizer a 
probabilidade de um resultado. 

Assim, por exemplo, o momento angular J; de um fóton só tem valores bem 
definidos nos autoestados |+) (J; =h)el-> (J; = —h). Num estado de polari- 
zação linear 18), o valor esperado de J, é dado pela regra Hld: 


T tai ae 
= la} = 
(3,) = (9]7.10) = } (cos 9 sen) oj s0) 
= h(cos6 sen 0) E 8) = ih(-cosB sen 8 + sen 8 cos8) 
i cos8) 


ou seja 


| [elementos diagonais da (8.901 (8.92) 
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Como os valores obtidos para J- em cada determinação (para cada fóton) só 
podem ser +7 e —h., a (8.92) significa, simplesmente, que cada um destes resul- 


tados tem a mesma probabilidade: 


1 
pem=p6n=> (8.93) 
o que é confirmado pelas (8.46), pois, pela Regra II, 
renke =| =5 neo 


De forma mais geral, como |+) e |—-) formam uma base, qualquer estado de 
polarização do fóton é da forma 


(8.95) 


e Iv, É = p é a probabilidade de que se encontre +A determinando J, no estado 
lv), com Iv- Fesin p dando a probabilidade de encontrar (—- h). O valor médio 
(J.) será então 


= 2:2+0-2)6)=Cr-nh | (896) 


que, sendo O < p < 1, pode assumir qualquer valor entre —ħ e +h (embora o va- 
lor em cada observação seja -Å ou +f). 

A (8.95) representa | v} como uma superposição quântica de |+) e |-). Esse 
é um conceito novo, tipicamente quântico, muito diferente do conceito clássico de 
ição linear de dois estados. Os valores de J, na superposição |v) não são 


intermediários entre os valores extremos correspondentes a |+) e |-). Os únicos 
valores possíveis continuam sendo +f e — +}. 

É a probabilidade de encontrar um desses resultados que assume valores inter- 
mediários entre 0 e 1 [por conseguinte, também o valor médio (8.96)]. 
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Flutuação 
O único caso em que a observação de uma grandeza 4 leva à certeza de um 
dado resultado é quando o estado la) observado é um auioesiado de Á (a = autova- 
lor). Nesse caso, 


(å), = (alÃla) = alala)= a (8.97) 


ou seja 


(à - (à),) lo) o| (8.98) 


Reciprocamente, se vale a (8.98), la) é um autoestado de À com autovalor 
(h= a 

Em qualquer outro caso, a observação de A levará a valores diferentes em 
diferentes observações. Num estado | u} diferente de um autoestado, os resultados 
flutuarão em torno do valor médio (À) Uma boa medida dessa flutuação ou in- 
certeza de A no estado lu) é o desvio quadrático médio, ( AA )ų„ , definido por 


[a a) = ((a = (9) = (ul (à E (a) la) (8.99) 


que leva em conta tanto flutuações positivas como negativas. 
Temos 


ou seja 
(a 4) = (4º), (4) | (8.100) 


Exemplo: Levando em conta a (8.92), a flutuação de J; no estado 10 > é 


= 7) (8.101) 
Or 
Pela (8.91), 
< (8.102) 
de forma que a (8.101) dá 
(a 1.) =ël (8.103) 
e 1 


resultado consistente com a (8.94). 


A Relação de Incerteza 


e E AR as 
Sejam À = À* e B = B” dois observáveis, lu) um vetor de estado e À um 


número real qualquer, e consideremos a desigualdade 


(eanl 


(a norma de qualquer vetor é não-negativa). Isso equivale a 


20 (8.104) 


(ul(ã -1n5) (à +ib) 20 (8.105) 


ou, desenvolvendo a expressão, 


ou seja, 
(8.106) 


onde definimos 


(8.107) 


A m , 
que se chama o comutador dos operadores À e Ê. Como é bem sabido, o produto 
de duas matrizes (ou dos operadores lineares a elas associados), em geral, não é 
comutativo. 


Temos, pela (8.63), como À e Ê são hermiteanos, 


(Ab - Bå] -bá-ab | TA 


de modo que 


| (8.107) 


E E am 


ou seja, o trinômio do 2.º grau em À (8.106) tem todos os seus coeficientes reais 
Para que seja > O para qualquer À é preciso então que seu discriminante seja < 0: 


(8.109) 


desigualdade válida para quaisquer operadores hermiteanos À e Ê e qualquer esta- 
do lu). 
Sejam X e Y dois operadores associados a observáveis, e tomemos na (8.109) 


B=1-(P), (8.110) 


Então, pela (8.99), será 


(4) = (8x). (8) =(4 7, (8.111) 


Por outro lado, é fácil ver (verifique!) que 
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[é -(8),.2-(9,]=[2.7] (8112) 
p \ fu “ 
pois um número sempre comuta com um operador. 

Finalmente, substituindo esses resultados na (8.109), resulta 


em, enile] (8.113) 


tu 


que se chama RELAÇÃO DE INCERTEZA: se X e Y não comutam, não é possível 
tornar ao mesmo tempo tão pequenas quanto se queira as flutuações em X e Y, 
qualquer que seja o estado lu > escolhido. 


Observações incompatíveis 


Em consequência da relação de incerteza, a física quântica tem uma carac- 


terística radicalmente diferente da física clássica: a determinação simultânea, com 


precisão, de duas grandezas físicas diferentes pode ser incompatível, ou seja, im- 
possível por princípio. 

Pela Regra Ilb, os resultados possíveis das determinações de um observável 
X são seus autovalores x. Logo após uma observação de X com resultado x, O 
sistema está no autoestado correspondente |x;): a observação prepara o sistema no 
estado |x;) (ex.: passagem por um analisador de polarização). 

Logo, após uma observação tanto de x (com resultado x) como de Y (com 
resultado y;) o sistema teria de estar num auioestado simultâneo de ambos, ley), 
com 


e) (8.114) 


o que implica 


[2 flle) = (28 -= #3) le) = (53, - s]a) 


Vimos na Seç. 8. 6 que, se só existe um autoestado le;> associado a cada 
autovalor, os autoestados formam uma base ortonormal [cf. (8.27)]. Logo, qualquer 
estado lv > é da forma 


0 (8.115) 


=Z vje (8.116) 


e a (8.115) implica 


(8.117) 


ou seja. 


(8.118) 


como consequência da mensurabilidade simultânea de X e Y em qualquer estado. 


Reciprocamente, com as mesmas hipóteses, a (8.118), aplicada aos autovetores 
le;) de X, implica 


Relef Ele) = Ele) (8.119) 


ou seja, Pie) também é autovetor de È, com o mesmo autovalor x; Como, por 
hipótese, só há um autovetor (a menos da normalização) com este autovalor, 
Yle;) tem de ser proporcional a | ej}, 


Ple) => ils) (8.120) 


Quando há mais de um autovetor linearmente independente associado ao mesmo 
autovalor (diz-se neste caso que o autovalor é degenerado), pode-se mostrar que a 
conclusão permanece válida, sendo possível construir uma base por um processo de 
ortonormalização bem conhecido em álgebra linear. 

A conclusão é portanto que a condição necessária e suficiente para que dois 
observáveis X e Y sejam compatíveis, isto é, possam sempre ambos ter valores bem 
definidos no mesmo estado quântico (tendo então uma base ortonormal comum de 
autovetores) é que X e Y comutem: [X,Y] = O. Assim, compatibilidade equivale a 
comutatividade. 

Exemplo: Consideremos os observáveis Bar e B (polarização linear do fó- 
ton nas direções O = 7/4 e 8 = 7/2, respectivamente). Pela (8.72), 


A LD g 00 
Ba= H | «Bi La 3 (8.121) 


o que dá 


A Rd 
aBa = 594) 


ss 1/00 
Papa = 301) 


mostrando que um fóton não pode ao mesmo tempo ter polarização linear bem de- 


finida na direção 6 = 7/4 e na direção O = 7/2. 
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Para verificar a incompatibilidade, 
consideremos um fóton incidente de 
polarização linear O = O que atravessa 
sucessivamente dois analisadores, um 
com q = 7/4 e outro com q = 1/2. 
Se atravessar antes o de q = 7/4 [fig. 
8.9(a)]. a probabilidade de passar por 
ele será cos (1/4) = 1/2, e o fóton 
emergirá linearmente polarizado com 
O = 7/4, de modo que a probabilida- 
de de passar pelo 2.º analisador será tam- 
bém cos (7/2 — 7/4) = 1/2. Logo, 
a probabilidade total de passagem é 
p=1/4 


Por outro lado, se invertemos a ordem [fig. 8.9(b)], a probabilidade total se 
toma p = 0. Logo a probabilidade total de passagem depende da ordem em que as 
determinações são efetuadas, mostrando que não pode haver um autoestado si- 


multâneo de Pr;4 e Prso . Isso também nos dá uma idéia do significado físico do 


comutador. 


8.11 Descrição quântica da atividade ótica natural 


Vimos na Seç. 5.6 que existem substâncias transparentes (tais como uma so- 
lução de água com açúcar ou um cristal de quartzo) que têm atividade ótica natu- 


ral: quando um feixe de luz linearmente polarizada penetra numa destas substân- 
cias, o plano de polarização gira de um ângulo proporcional à profundidade de 


penetração. 
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Tomando o eixo z ao longo da direção de propagação, com origem na face de 
entrada, podemos dizer então que, se o vetor de estado inicial de polarização é 
t0)=| =] (direção de polarização 6). teremos, após penetrar uma distância z no 


meio, um vetor de estado 


cos(O + oz) 

le&)= ( ( , l (8.123) 
sen @ + az) 

onde & é o poder rotatório específico do meio. 

Até agora, discutimos apenas o que se poderia chamar de cinemática quântica: 
como representar o estado de um sistema quântico (polarização do fóton), o que se 
faz por um vetor de estado normalizado, e como representar grandezas observáveis. 
através de operadores lineares sobre os vetores de estado. A atividade ótica natural 
é um cfeito dinâmico, associado à evolução de um vetor de estado; neste caso. 
devido à propagação dos fótons num mcio material. 

Na dinâmica newtoniana, a evolução do estado de uma partícula (movimento) 
é descrita por uma equação diferencial, a 2º lei de Newton. Aqui estamos descre- 
vendo a evolução não no tempo, mas em z (profundidade de penetração no meio): 
vamos tratar de fazê-lo através de uma equação diferencial, obtida a partir de sua 
solução (8.123), que dá 


-sen (8 + tz 


o(s) = A09) =R for er se 


O) (8.124) 


onde representamos o resultado por um operador linear (como é a derivação) apli- 
cado a 10(z)). Vamos achar D. 


A evolução em z tem de preservar a normalização do vetor de estado, ou seja, 
<0 ()10(2)) = |: 


aE) E) = (06) 


OROI 
te tjór 


= (o (bjo E) + (96) 


ôe) = 0 (8.125) 


o que dá 


(8.126) 


(8.127) 
onde À é hermiteano. 
A representação geral de uma matriz hermiteana 2 x 2 é 
aei l 
À=|. |, aeb reais (8-128) 
ec p | 
(8.129) 


OE A a 


a cos®, + c send, -resne fem 
j c” cosO, +b sen8, F ia cos8, c i 


ou seja, 


e É 
ilâ 


0 ci r: 
gfi “to (8.130) 


Pela (8.91). 


(8.131) 


onde J, é o operador momento angular do fóton. A (8.130) é uma equação de evo- 
lução quântica para o vetor de estado de polarização de um fóton num meio oti- 
camente ativo com poder rotatório œ. Embora obtida para estados de polarização 
linear, podemos tomá-la como aplicável a qualquer estado de polarização, pois os 
estados de polarização linear definem uma base. 
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a 
Vemos então imediatamente que os autoestados de J, têm características espe- 
ciais. Pelas (8.90), são os estados de polarização circular: 


(8.132) 


(8.133) 


Como & 
circularmente polarizado (esquerdo ou direito) permanece com seu estado de polari- 


“= é um fator de fase, que não altera v estadu, vemos que um fóton 


zação inalterado, ou seja, é estacionário com respeito à propagação num meio oti- 
camente ativo. 

Os estados estacionários |+) da evolução num meio oticamente ativo consti- 
tuem uma base especialmente cômoda para obter a evolução de um vetor de estado 
qualquer, dada a linearidade da equação de evolução (8.130). 

Com efeito, como It). - o formam uma base, qualquer estado de polarização 
do fóton pode ser escrito como 


(8.134) 


e, pelas (8.133) e pela linearidade, o estado de polarização evolui com 


mat ÉS Deo] (8.135) 


Em particular, para o estado |8) de polarização linear na direção 9, as (8.46) dão 


(8.136) 


e a (8.135) leva a 


(8.137) 


pá 
| os vetores I+): 


Na representação em que 18) = 
P Š quelBÃ S eno 


são dados pela (8.25), e 


a (8.137) corresponde à solução (8.123). como é fácil verificar. 


O operador de evolução 


Na equação de evolução (8.130), 


lo = 
E u) = -i Áju) (8.138) 


” g wA 
aplicada a um vetor de estado qualquer 1u), Â = LJ. é um operador constante 
(independente de =). 


Se pudéssemos integrar a (8.138) como uma eq. diferencial ordinária, a solu- 
ção seria 


lu). = exp Gå (8.139) 


mas, tratando-se de um operador. é preciso verificar que sentido tem a exponencial. 
Para isso, notemos que, em termos de seus autovalores a; e autovetores 
correspondentes | e;), o operador hermiteano Å é representado pela (8.67). 


(8.140) 


e os le;) formam uma base ortonormal. Dai decorre imediatamente que (probl. 8.4) 


fr E 8.141 
Hs I EuD 


o que dá 


>> 


r=3(6 JH, ë- 


o mesmo valendo para qualquer potência ou polinômio em À. Para matrizes, a 
(8.140) é uma representação em que À é diagonal, e qualquer potência de Â se 
calcula imediatamente. 
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Por extensão, para qualquer função f(z) que possa ser expandida em série de 
potências. definimos 


PORNON | (8.142) 


o que se aplica, em particular, à função exponencial. 
Os cálculos que levaram à (8.91) dão: 


|a IA -A if d)| 
=|p6]=+ J=- Esd || 
| 1, = Ee] i Jatta] 
| 
a ii De d 
HE a code] | 3 
[É IX o |) aTa] (8.143) 
de modo que, com À = œ )./% [ef.(8.131)], 
Û (z) = exp Giâz)= aE H 
Î Sh ten 
Finalmente, a (8.139) fica 
lu), = do teta 
g 
onde o operador de evolução em z, U (z), é dado por 
Dem fofo) =se) 
Ú(z)= (8.145) 
(sen (az) cos(a z) 
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dle teorie 


Dado um estado inicial de polarização qualquer, 
E ja] 
BA aa (8.146) 


a (8.145) leva à solução da equação de evolução (8.138) 


(8.147) 


o -{ cos(a 2) -e mte] 


a sen (az) + c, cos (az) 


que se reduz a |u} para z = O e permite recuperar a (8.123). 


PROBLEMAS 


1. Sejam lu> e |y> dois vetores de estado fixos (normalizados) e À = re‘? 
um número complexo variável. Demonstre que 


1= Reel 


| min |ju) 1 Af 
| a IDARSD] 


quando À varia, onde o mínimo é atingido para À = -< vlu >. Deduza daí a desi- 
gualdade de Schwarz 


ket sif of iof) 


Sugestão: Exprima a condição de mínimo em termos de r e 0. 
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2. Obtenha os vetores de estado de polarização circular na representação alter- 


nativa, em que 


por um método análogo ao que levou às (8.25). Interprete o resultado. 


3. Mostre que, para qualquer operador À, tem-se 


e cd) 


F 
4. Mostre que os operadores de projeção II; definidos nas (8.48) têm a pro- 


priedade 


Demonstre que daí decorre que os únicos autovalores desses operadores são O e 1. 


Mostre que 
IM, II, =0 


| 
pd 
5. Mostre que, na representação em que 
= 
DESSK 
A2 feio 


o observável Pp (polarização linear do fóton na direção 0) é representado pela 


matriz 


6. Demonstre a regra do produto (8.58). 


7. Um feixe de fótons linearmente polarizados na direção x incide, em seqüên- 
cia, sobre um par de analisadures de polarização. O primeiro deles tem seu eixo de 
transmissão máxima orientado segundo um ângulo 8; com a direção x, e o segundo 
tem seu eixo de transmissão máxima orientado segundo um ângulo 6; com a di- 
reção x. 

(a) Qual é a probabilidade de que um fóton passe através dos dois analisa- 
dores? 

(b) Para 6, fixo, qual é o valor de 0; para o qual essa probabilidade de trans- 
missão através dos dois analisadores será máxima? 


8. Considere o seguinte vetor de estado de polarização de um fóton: 


jy) = & 


2 


jpt- 


2 


onde |+) e |-) são vetores de estado normalizados de polarização circular esquer- 
da e direita, respectivamente. 

(a) Mostre que IN) é normalizado. 

(b) Mostre que ly) é linearmente polarizado, e calcule o ângulo de polari- 
zação, em valor absoluto e sinal. 


9. Um fóton linearmente polarizado na direção 6 incide sobre um analisador 
orientado na direção q, podendo atravessá-lo (resultado = 1) ou não (resultado = 0) 
Mostre que a incerteza no resultado é 


AX = 
| 


10. Mostre que 


se e somente se 9 — Q = n 7/2, com n inteiro. Discuta a interpretação física desse 


resultado. 


11. Calcule [ 5, 2.1. 
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12. Mostre que, para 


tem-se, 
AR) (11), 2 ana - ef) sen (20) — (ei o +; a) cos co | 


e que o segundo membro é da ordem de fi. 


A EQUAÇÃO DE 
SCHRÓDINGER 


Neste capítulo, vamos generalizar os princípios básicos desenvolvidos no 
capítulo 8, formulando a equação de Schrödinger, em que se baseia a dinâmica 
quântica 


1 A equação de Sehródinger unidimonsienal 


-3 -2 1 næ 1 2 Consideremos uma partícula não-rela- 


3 2 5 o ó a g tivística de massa m limitada a maver 
se somente ao longo de uma direção, 
Fig. 9.1 Divisão em intervalos que tomaremos como eixo Ox. 


Uma observação da partícula pode encontrá-la em qualquer ponto do eixo, ou 
seja, os valores possíveis do observável “posição da partícula” são todos os núme- 


ros reais, correspondendo a uma infinidade contínua de valores possíveis. 
Como passo intermediário mais simples para descrever essa situação, vamos esta- 
belecer primeiro uma descrição aproximada, dividindo a reta em intervalos idênticos 


(fig. 9.1), de comprimento 8. Diremos que a partícula está no intervalo n quando 


nôsx<(r+I) (EDENE 2y) (9.1) 


Podemos interpretar como sendo a precisão na determinação da posição (o 
erro é sô). 


Isso leva. generalizando os conceitos do Cap. 8, a uma representação aproxi- 
mada do vetor de estado da partícula em termos de sua posição. 


Il) =| e (9.2) 


como um vetor coluna de infinitas componentes (infinidade discreta). onde o núme- 
ro complexo cy representa a amplitude de probabilidade de encontrar a partícula no 
intervalo n (IGP = probabilidade de encontrar a partícula no intervalo n), com a 
condição de normalização 


Sy 


(9.3) 


Para passar à representação contínua, notemos que a probabilidade |c, É, para 
ô suficientemente pequeno, deve ser proporcional ao comprimento ô do intervalo. 
Quando 8 > 0. 


_ densidade dc probabilidade de encontrar 


= (9.4) 
a particula em x, centro do intervalo 3. 


Logo, ca / Vô devc também tender a um limite finito, que representa a ampli- 
tude de densidade de probabilidade correspondente, q (x): 


onde [cf.(8.6)] 
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9.1 Aequação 


| lo dx = d p(x) = probabilidade de encontrar a particula | (9.6) 
EN, 


densidade de entre x e x+ dx, | 
probabilidade 


com a condição de normalização [forma limite da (9.3)] 


fofas: (9.7) 


O “bra” correspondente à (9.2) é 
Ghil É) (9.8) 


e a (9.7) é o limite, para à —> 0, de 


(ọlọ) = Èi & -Że (5) (a) (9.9) 


n= n= 


Analogamente, o produto escalar de dois vetores de estado |p) e Iy ), associados 
às amplitudes de densidade de probabilidade q (x) e y(x), é dado por 


Ivy) jo via | (9.10) 


As amplitudes de densidade de probabilidade são chamadas de funções de onda. 
Chegamos assim, finalmente, às funções de onda de Schrödinger da Seç. 7.9. 


mas agora conhecemos sua interpretação física. 
Em geral, numa descrição dinâmica, a função de onda associada a uma partí- 
cula deve depender do tempo 1: 


l> yer 011) 

A relação de Einstein E = A q, estendida por de Broglie a uma partícula qual- 
quer [cf. (7.59)], sugere que, para uma partícula de energia E, essa dependência do 
tempo seja da forma 


[vE ee" = en] (9.12) 


o que daria 


=Ey (9.13) 


a 
Avtv Gy] (9.14) 


para uma partícula de massa m num potencial V(x). 
Especializando esses resultados ao caso unidimensional, as (9.13) e (9.14) dariam 


m- 
|| E os il 
| E AL] as 


que é a EQUAÇÃO DE SCHRÖDINGER DEPENDENTE DO TEMPO para o movi- 
mento unidimensional no potencial V (x). 

Para o vetor de estado |y } correspondente, essa é uma equação de evolução 
temporal 


(9.16) 
[análoga à equação de evolução espacial (8.130)], onde 
F P F sa n 
A am Tvey =Ĥy] (9.17) 
m dx | 
com o operador 
(9.18) 


cuja atuação diretamente sobre uma função de onda y é definida pela (9.17). 
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H chama-se operador hamiltoniano. Embora tenhamos partido de um caso par- 
ticular (estado estacionário), a (9.16) tem validade geral: para a mecânica quântica, 
é a lei fundamenial da dinâmica (como a 2º lei de Newton para a mecânica clás- 
sica). 

Ao contrário da 2º lei de Newton. onde aparece 2/0! ,a (9.16) é de 1º 
ordem em 1, contendo apenas d/dt. Logo, basta uma condição inicial, 14 }-o , 
para determinar a solução. Isso é consistente com o fato de que o vetor de estado 
Iy);=o descreve completamente o estado quântico do sistema no instante inicial. 


9.2 Conjugado hermiteano 


O conjugado hermiteano À* de um operador À define-se de forma análoga à 
(8.61): 


(9.19) 


(elah = 


ou seja 


fe DE voje} = Ív DEKONE (220) 


para qualquer par de funções de onda q (x) e y(x). 
Trocando Å —> À* e usando ( Â* )* = À (Probl. 9.3), vem 


Jv afili -Í [evo ] Tocos, 020 


Exemplo: Seja À = + Integrando por partes, 
z 


je ivgas fe) ax-[o owo] 
+ EA Ox e 


- | Eyfa 


O termo integrado — 0 em +, porque q e y têm de ser normalizáveis, e a 
(9.7) implica que 


“Jim 9(G)=0 


Logo, tomando o complexo conjugado da relação acima. 


e EE as] a [it gp (9.22) 


(2) Ss (9.23) 
dx 


mostrando que esse operador é anti-hermiieano. Isso também implica que 


(9.24) 


ou seja, ¿9 / ð x é um operador hermiteano. 
Como o quadrado de um operador hermiteano também é hermiteano [cf. 
(8.63)], vemos que 92/90 x? é hermiteano, e a (9.18) dá 


Ei E (9.25) 


ou seja, O hamitoniano é um operador hermiteano. 
Isto permite verificar uma condição de consistência importante: a evolução 
dinâmica dada pela equação de Schrödinger preserva a normalização do vetor de 


estado. 
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Com efeito, temos 


tlve dy dás = Í 


= kivana jev) va] 
Iv ruas paea) 


Valor esperado e derivada temporal 


O valor esperado (médio) de um observável À num estado ių) é dado por 


| ( Â) a (vl Â b) = jy (1) E vE ja | (9.26) 


Supondo que Á não contém o tempo explicitamente, o valor esperado evolui com o 
tempo devido à evolução de w, o que dá 
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ou seja, 
é : (EA 
(A) =—( 28 9.27 
dt\ a ih \ fy asi 
Em particular, 
O valor esperado do hamiltoniano (9.28) 
se conserva 


9.3 Operadores posição e momento 


A interpretação física de Iy(x.1)Ê dx como probabilidade de encontrar a 
partícula entre x e x + dx no instante 7 mostra que o valor esperado da posição da 
partícula nesse instante tem de ser definido por 


filvedfas=[v Ewe (9.29) 
onde 
E y(t) = x y (xt)! (9.30) 


ou seja, o observável z = “posição da partícula” é um operador equivalente à mul- 
tiplicação por x. 

Para definir o observável velocidade ` da partícula, ou, equivalentemente, seu 
momento m y vamos usar o princípio de correspondência, pelo qual devemos ter 


(9.31) 


num estado descrito por y (x,t). 
A (9.27) dá 


= at : â] ), (9.32) 


z a 2 
[e j à] = El: ã | (9.33) 


Para calcular o comutador entre esses dois operadores, basta aplicá-lo a uma fun- 
ção de onda qualquer WY: 


a asy F p 
[dae “a pe Gy) (9.34) 


Temos, pela (9.30), 


ma O RR. dy dv Fy 
32 EW= 5 OEE tr a 
de modo que a (9.34) fica 


(9.35) 


(9.36) 


OPERADOR MOMENTO (9.37) 


(9.38) 


ou seja, que o hamiltoniano equivale ao observável energia da partícula. Obtemos 
assim a interpretação física da (9.28): ela garante a conservação do valor esperado 
da energia. 


Temos, por outro lado, 


ou seja, 
314] 
s T 9.39: 
lež] 039 
Combinando esse resultado com a (9.37), obtemos a regra de comutação de Hei- 
senberg 
(9.40) 
Como a dedução da (8.113) é válida em geral, daí resulta 
peter 9.41) 
i 2 


que é a célebre relação de incerteza de Heisenberg para posição e momento de 
uma partícula. Vemos que posição e momento (ou velocidade) de uma partícula 
são observáveis incompatíveis: não podem ter, ao mesmo tempo, valores bem 
definidos, em nenhum estado quântico. As flutuações recíprocas têm de obede- 
cer à (9.41). 


9.4 O teorema de Ehrenfest 


Do ponto de vista do princípio de correspondência, podemos comparar com a 
mecânica clássica as equações de movimento para valores médios de observáveis 
quânticos. Já nos valemos dessa idéia para definir o operador momento p por 


(9.42) 
dra AT: a] l 
Ay coa É 9.43 
a Ph = E? a SRI 
Como p comuta com p°, a (9.38) då 
(9.44) 


Calculamos o comutador aplicando ambos os membros a uma função de onda y 
arbitrária: 


roi E xl” ()v]- ros 


ou seja, 
a 2-2”, 
| E ve] dx (ts) 


Substituindo esse resultado nas (9.44) e (9.43), obtemos o teorema de Ehrenfest 


ds JM 9.46) 
Far > (| sas 
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Classicamente, a força F que atua sobre a partícula num campo de energia 
potencial V(x)éF =-9V/ dx, de forma que as (9.42) e (9.46) implicam que os 
valores esperados obedecem à 2º lei de Newton, resultado inteiramente conforme 
ao princípio de correspondência. 

Entretanto, esse resultado de per si está longe de dar conta das sutilezas en- 
volvidas na transição entre a mecânica quântica e a mecânica clássica. Ele nada diz 
sobre as flutuações nem sobre as diferenças conceituais e de interpretação; em par- 
ticular, sobre o que acontece com o estado quântico de um sistema em confronto 
com o conceito clássico do estado. 


9.5 Autofunções do momento 


Uma autofunção do operador momento (9.37) é definida por 


f E) 
'dylo)= ne = py,(x) (9.47) 


onde p é o autovalor. A solução dessa equação diferencial é 


Enio GE sas 
Uol)= Ce é (9.48) 
que é uma onda plana de momento 

[p=hk (e <p<)| (9.49) 


onde p pode tomar todos os valores reais. 


A (9.49) é a relação de de Broglie (7.54) entre momento e número de onda k. 
A (9.48) dá 


Cf = constante | (9.50) 


ivel- 


de forma que yp(x) não representa realmente um estado quântico aceitável, por- 
que não pode ser normalizada: a integral de normalização (9.7) diverge. 

Sabemos efetivamente que uma onda plana é uma idealização, um caso limite. 
Do ponto de vista do princípio de incerteza (9.41), corresponderia a Ap = 0, o que 
requer Ax — œ, ou seja, indeterminação completa da posição: daí o valor con- 
stante da “densidade de probabilidade” (9.50) 
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9.6 Densi 


Embora a (9.48) represente uma “autofunção imprópria”, as ondas planas, co- 
mo na ótica, representam uma idealização extremamente conveniente. Vimos para 
os estados de polarização que os autovetores de um observável formam uma base, 
ou seja, que é possível expandir qualquer vetor de estado como superposição dos 
autovetores, 

Apesar do caráter impróprio das autofunções do momento, essa propriedade se 
generaliza para elas: qualquer função de onda y (x) normalizável (representando 
portanto um estado guântico aceitável) pode ser expandida em termos das (9.48): 


ve)= fe (eia k | (9.51) 


onde a soma sobre todos os autovalores corresponde aqui a uma integral sobre toda 
a reta. 

Na análise matemática, a (9.51) corresponde ao que se chama de expansão em 
integral de Fourier, e é possível dar expressões explícitas para o cálculo dos coe- 
ficientes c(X). 

O conjunto dos autovalores de um operador chama-se espectro desse operador. 
[Por exemplo, pela (3.90), o espectro; de 2. para Le fóton é discreto, formado pelos 
autovalores (—h, +hJ]. Tanto para ï como para p encontramos um espectro con- 
tínuo de autovalores (x e p podem assumir qualquer valor real). 


9.6 Densidade de corrente de probabilidade 
Vimos na Seç. 9.2 que há conservação global da probabilidade: 


aver dx- 0, 


(9.52) 


Entretanto, há também uma lei de conservação Jocal, análoga à equação da con- 
tinuidade na hidrodinâmica e à conservação local da carga elétrica. 


Sabemos que a densidade de probabilidade p (x,t) é dada por 


oG) = us (9.53) 


Logo, 


(9.54) 


il 
E 
— 
=, 
F 
REM 
z 
E 
= 
li 
<, 
v 
< 
£ 
o 
IE 
= 


Usando a equação de Schrödinger (9.15), isso dá 


ap yf é y Tv[ é Py . 
E: E e Es +V 
dt dh | 2m dx ewo] ih $ Cody 


af ay ay) 
Zm Ay k da!) 
ou finalmente, 
[98,210] (9.54) 
(dr əx | 


onde 


| a EA 
Lie)= h [re ,) (9.55) 


EEE 
| F +dvj=0 (9.56) 


e representa a lei de conservação da probabilidade. 
Com efeito, integrando ambos os membros sobre um segmento de reta entre 
X èx, vem, com x < Xz, 


aloe E [Haas = (= 164.1) (9.57) 
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ou seja, a taxa de decréscimo, por unidade de tempo, da probabilidade de encontrar 
a partícula entre x, e xz, é igual ao fluxo de probabilidade, por unidade de tempo, 
que sai por xz , menos aquele que entra por xı. Logo, j(x,t) dado pela (9.55), 
representa a corrente de probabilidade (em uma dimensão, a densidade de corrente 
se confunde com a corrente, porque o “fluxo” é tomado através de um ponto). 

Em particular, fazendo xı — — se, x: —> so na (9.57), e observando que j deve 
tender a zero no infinito para vetores de estado normalizados, recuperamos a lei de 
conservação global (9.52). 


Exemplo 


Vamos calcular j para a autofunção do momento (9,48): 


ow 


= Ceira Yp 
Mamee Er 


(9.58) 


que corresponde à expressão bem conhecida da corrente associada a um escoa- 


mento com densidade p e velocidade v. 
As considerações precedentes se aplicam ao caso geral da equação de Schródin- 
ger na presença de um potencial V. Vamos considerar agora partículas livres (V = 0). 


9.7 Partículas livres 


Para partículas livres em uma dimensão, a equação de Schrödinger fica 


(9.59) 
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so de Seiôdinger 


Estados estacionários 


Pelas (9.12) a (9.14), temos, para um estado estacionário de energia E, 


RAÇA O | (9.60) 


onde 


» dor or Es ) 
-= = | + E |gr 
2m dá [ax tm) 


(9.61) 


Como a energia é puramente cinética, podemos escrever 


, com p = +/2mE | (9.62) 


É gë 2 
[i +(2) PAET] (9.63) 


e a (9.61) fica 


cuja solução geral é 


qr (Q) = CC e (9.64) 


que é uma superposição de autoestados do momento. 


Temos aqui o 1º exemplo de degenerescência: cada autovalor E > O é dupla- 
mente degenerado, com duas antofunções linearmente independentes (+p e —p) 
correspondendo à possibilidade de a partícula se mover para a direita ou para a 
esquerda, com a mesma energia E. 

Como as autofunções do momento, qr(x) é uma autofunção imprópria, não 


normalizável. Uma interpretação possível dos resultados, por exemplo de 


ACOELA irh Bud (9.65) 


é que representa não uma partícula única, mas um feixe estacionário de partículas 
de momento +p e de energia E (feixe monoenergético): A densidade de partículas 
no feixe é 


Postas livres 349 


o= haf =e (9.69) 
e a densidade de corrente de partículas no feixe é dada pela (9.58), j = pv = pp/m. 
Podemos pensar numa experiência com o feixe como um grande número de repeti- 
ções independentes de uma experiência com uma única partícula. Analogamente, a 
(9.64) representa, nessa interpretação, a superposição de dois feixes de partículas 
livres, um viajando para a direita e o outro para a esquerda. 


Pacotes de ondas 
O estado mais geral possível de uma partícula livre em uma dimensão é obtido 
tomando uma expansão nas autofunções da energia (estados estacionários) como base: 


| y)= jepe CEM dp | (9.67) 
| De 


onde os autoestados do tipo C+ (C.) correspondem à integral de O a œ (de —oo a 0), 
cE=p/(2m). 

Pela teoria da integral de Fourier [cf.(9.51)], podemos representar dessa forma 
qualquer estado normalizável. A Regra I indica que 1C(p)P dp deve ser propor- 
cional à probabitidade de encontrar a partícula com momento entre p e p + dp. 

Um estado normalizável da forma (9.67) chama-se um pacote de ondas de 
partículas livres. 

O princípio de correspondência sugere que se possa empregar um pacote de 
ondas para representar uma partícula aproximadamente localizada. 

Os exemplos de pacotes de ondas eletromagnéticas analisados na Seç. 3.6, on- 
de discutimos a relação entre tempo de coerência AT e largura espectral A q), ob- 
tendo, na (3.49), Aw AT ~ 27, podem ser aplicados à (9.51), pois, em ambos os 
casos, trata-se de uma integral de Fourier. Basta substituir t> x e © — k [cf(3.52)]. 

Inferimos então que, se |c (4)? tem um pico de largura Ak, com centro em 
F, e lg (x) tem um pico de largura A x, com centro em x, deve ser (fig. 9.2) 


Alog! 


Ne 


>k >x 


t 
i 
t 
x 


Fig. 9.2 Larguras de pacote em x e k 
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AxAk- 27 (9.68) 


(9.69) 


o que é consistente com a relação de incerteza (9.41) e fornece uma dedução heu- 
rística alternativa dessa relação. Para isto, interpretamos Ax e Ap como as incer- 
tezas (flutuações) em x e p, respectivamente, no pacote de ondas. 


Analogamente, podemos esperar que seja 


(9.70) 


e podemos usar a (9.67) para estudar a evolução temporal do centro de um pacote 
que, para t = 0, é dado pela (9.51). 
Reescrevendo a (9.67) sob a forma [cf.(7.59)] 


vlu)= [ee ar, t) = help) 07D 
a relação entre © e k é dada por 


o= 


E P -43 Loak] 


= w=å | (9.12) 
ñ 2mh 2mh | 2m | 
de modo que a velocidade de fase 0/k varia com k (~. com o comprimento de 
onda): há dispersão. 
Vimos no estudo da interferência (superposição) de ondas [Fís. Bás. 2. Seç. 
5.5(c)] que, nesse caso, o pacote de ondas se propaga com a velocidade de grupo 


do 
n= (52). (9.73) 
A (9.72) dá = 
| ak td, 
v, =—= (9.74) 
| m m 


9.8 A equação de Schrödinger irdinensioral 351 


o que é consistente com o teorema de Ehrenfest: o pacote de ondas se propaga com 
a velocidade média da partícula. 

Entretanto, devido à existência de dispersão, o pacote inicial tende a defor- 
mar-se ao longo da propagação. Além disso, a incerteza de velocidade A p/m, para 
partículas livres, implica numa incerteza adicional -(Ap/m )t na largura Ax do 
pacote após um tempo é, ou seja, há um alastramento do pacote de ondas. 


9.8 A equação de Schrödinger tridimensional 


Para o movimento tridimensional de uma partícula de massa m, a função de 
onda continua obedecendo à equação de evolução (9.16), mas o 2.º membro agora 
é dado pela (9.14): 


ov (9:75) 


Esta é a equação de Schrödinger tridimensional dependente do tempo para uma 
partícula não-relativística. 
A densidade de probabilidade é dada por 


Ra Dele (9.76) 
com a condição de normalização 
fve es E77) 


onde a integral é estendida a todo O espaço. 
A definição do conjugado hermiteano é 


(9.78) 


O operador de posição X é definido por 


Xv (x,0)= xy (x,º) (9.79) 


(9.80) 


com 


(9.81) 


(9.82) 


Os observáveis (*,3,2) [ou (Ps, Pr, :)] são compatíveis, pois estão asso- 
ciados a graus de liberdade independentes: 


[e ERE J=[e-J=[5..5)-[5..2]=[5 Afro] 
| =f aĝ- sÈ] f | 


As (9.82) e (9.83) são as regras de comutação canônicas de Heisenberg. 


A lei de conservação local da probabilidade se obtém de forma análoga à 
(9.54): 


2 en i [ea] 
mE (9.84) 
= SE) (av ysv”) 
Temos (Fís. Bás. 3, Seg. 4.6) 
div (vu =y" div Vy)+V y -Vy pio 


Ay 


9.8 A equação de Schrödinger tridimensional 


Intercambiando y + y e subtraindo membro a membro, resulta 
div Vy- wy = Ay vay" 


de modo que a (9.84) dá 


Prdvj=o 


onde a densidade de corrente de probabilidade j é dada por 


É Fe sã] 
=50(Vyv-yvy), 


2mi 


que se reduz à (9.55) no caso unidimensional, 
Um autoestado do momento Wp (x), com 


[pu l)= VW, 6)= PU, 6) | 


é da forma 


pois, como é fácil verificar, 


grad (et dé Ike 


353 


(9.86) 


(9.87) 


(9.88) 


(9.89) 


(9.90) 


(9.91) 


Qualquer função de onda normalizável pode ser expandida em autofunções do 


momento, 
vs judo) dk 


Esta integral de Fourier tridimensional generaliza a (9.51). 


(9.92) 


Os estados estacionários da equação de Schrödinger para partículas livres 


[V(x) = 0] são da forma (ondas planas monocromáticas) 
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(es 


x egenerescência infinita: (9.93) 
veE)=Ce k aponta em qualquer direção do espaço 


onde 


kopine EA (9.94) 
h 2mh 2m 


A solução geral da equação de Schrödinger para partículas livres é um pacote de 
ondas tridimensional, que generaliza a (9.67): 


v(s)= [Us (9.95) 
que se reduz ao pacote inicial (9.92) para t = 0. 
9.9 A relação de incerieza 
As regras de comutação canônicas (9.82) implicam 
ls 1 x 
AFAR So TAIA PR E X (9.96) 


ao passo que todos os demais pares de observáveis podem ser determinados con- 
juntamente com precisão. 


Podemos visualizar a origem desses resultados analisando experimentos conce- 
bíveis para localização de uma partícula. 
x | (a) Diafragma 
Poderíamos tratar de localizar a posição 
numa dada direção x fazendo um feixe de 


Ro elétrons (por exemplo) incidir perpendi- 
EA cularmente sobre um diafragma de largu- 

iii ra d na direção x (fig. 9.3), o que levaria 
RA a uma incerteza 

e 


Ax~d (9.97) 


na coordenada x dos elétrons que atraves- 
Fig. 9.3 Localização por um diafragma sam o diafragma. Entretanto, embora se 
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pudesse ter p- = 0 (-. Ap, = 0) antes do atravessamento, isto deixa de ser ver- 


dade depois, devido à difração (propriedades ondulatórias do elétron). 


Com efeito, conforme vimos no tratamento da difração por uma fenda (Seç. 


4.7), a abertura angular do feixe difratado é ~ 6. onde [cf.(7.55)] 


sen 9 tod 
p 


o que leva a uma incerteza em p; da ordem de 
h 
Ap, = peni = 
d 


Combinando as (9.97) e (9.99), resulta 


E ETA 
[AxAp, ~h] 


(b) O “microscópio” de Heisenberg 


Plano 


Objetiva 


Aen A 
sen O 


(9.98) 


(9.99) 


(9.100) 


Poderíamos tentar localizar o elétron ob- 
focal servando-o num (super) microscópio. En- 
tretanto, devido à natureza ondulatória da 
luz, como vimos na Seç. 4.8, a localiza- 
ção não pode ser mais precisa do que o 
poder separador do microscópio, dado por 


(9.101) 


GANA NANA —— 
Luz (à) X x onde À é o comprimento de onda da luz 
elétron empregada e 6 é a abertura angular da 
Fig. 9.4 “Microscópio"de Heisenberg objetiva (fig. 9.4). 


Por outro lado, devido à natureza corpuscular da luz, o espalhamento de luz 


pelo elétron modifica seu momento. Para minimizar a transferência de momento, 


podemos espalhar um único fóton. 
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Mas não sabemos em que direção, dentro do ângulo 8 de abertura da objetiva, 
o fóton será espalhado. Logo, há uma incerteza A py na componente x do momento 
do fóton espalhado, dada por 


2nh 


Ap, ~ psen6 = hksen6 = sen O (9.102) 


Pela conservação do momento (recuo), essa é também a incerteza A p, na com- 
ponente py do elétron. As (9.101) e (9.102) dão 


| (9.103) 


PROBLEMAS 


1, Demonstre que 


z 
2. Use a relação do Problema 1 para calca Ž | a partir de [5 z] 
É e x 


3. Calcule 


para n inteiro. 
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4. Os operadores de paridade P e de translação por a, Ta, em uma dimensão, 
são definidos por 


ZEO 
Calcule os hermiteanos conjugados de p e de Ta 
5. Calcule p e j para o estado estacionário de energia E de uma partícula livre 
ve (œ 1) = [C exp (ipx / h) + C exp (ipx / A)]exp (Et / A) 


6. Para a equação de Schrödinger tridimensional (9.75), demonstre o teorema 
de Ehrenfest 


7. Demonstre que se A é um operador hermiteano, 
42 
> 
RA ed 


em qualquer estado Y. 


8. Para o movimento num potencial unidimensional V (x), demonstre que, em 


qualguer estado W, 


10 


SISTEMAS 
QUÂNTICOS 
SIMPLES 


Vamos considerar agora uma série de exemplos simples de sistemas quânti- 
cos, a fim de ilustrar alguns efeitos quânticos importantes. Em cada caso, faremos 
uso, dentro de suas limitações, da relação com a mecânica clássica, bem como da 
analogia ótico-mecânica c da imagem ondulatória clássica. Discussões mais com- 
pletas são dadas em cursos de física atômica, física nuclear, física da matéria con- 
densada, etc... 


710.1 Estados estacionários em uma dimensão 


Conforme vimos na Seç. 9.1, um estado estacionário de energia E é descrito 
por uma função de onda 


[We (et) = Or a (10.1) 
onde 
AoE) (10.2) 


É A 
ou seja, Q; é uma autofunção de energia E. O conjunto dos autovalores de H dá 
o especiro de energia do sistema. 
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nticos simples 


Para o movimento num potencial unidimensional, a (10.2) fica (omitindo o 
índice E ) 


2 
7 IVe) = Eg= Ro (10.3) 
m 


onde ko seria o número de onda na ausência do potencial (V = 0). A (10.3) 


equivale a 
dq 


iG) geo] (10.4) 


onde 


(10.5) 


e ()=1- ra 


é o quadrado do índice de refração na analogia ótico-mecânica [cf. (7.64), (7.65). 
Na mecânica clássica, para uma partícula de energia total E dada, 


i a 
E-Ve)= z3r e) (10.6) 


é a energia cinética da partícula na posição x, contanto que seja E > V(x), caso 
em que a posição x é acessível ao movimento da partícula (região classicamente 
permitida). 


E Vimos na mecânica clássica (Fís. Bás. 
1, Seç. 6.5) que, num potencial V (x) 
como o da fig. 10.1, as regiões permi- 
tidas variam com a energia E da partí- 
cula. Para uma energia E; > V(x) 
para V(x) , a reta toda é permitida e o 
movimento é ilimitado. 

Já para E = E» (fig. 10.1), há um pon- 
to xo onde 


x 


Es Vo] (10.7) 


Fig. 10.1 Pontos de inversão 
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que se chama ponto de inversão ou de retorno, onde p(x) se anula e troca de sinal: 
o movimento da partícula pode ser ilimitado à esquerda mas cla não pode ultrapas- 
sar xo: se vier de— œ , ela inverte o sentido do movimento ao atingir x e retorna 
a — es 

Para uma energia E = Es (fig. 10.1), o movimento é confinado à região entre 
os pontos de retorno x, e x»: a partícula oscila indefinidamente entre esses pontos. 

Já se pensarmos do ponto de vista da ótica ondulatória, numa região onde n(x) 
é constante, com E > V (região permitida), a solução da (10.4) é da forma 


ql) = Ae 4 A att (10.8) 


representando ondas que podem propagar-se nos dois sentidos. 
Entretanto, se E < V (região classicamente proibida), com n 2<0 na (10.5). 
podemos tomar 


(10.9) 


e ainda existem soluções do tipo 


o (1) = ent (10.10) 


que são exponencialmente atenuadas para a direita ou para a esquerda. Encontra- 
mos soluções desse tipo, chamadas de ondas evanescentes, no estudo da reflexão 
total (Seç. 5.10). 

10.2 Degrau de potencial 


É o potencial 


væ- 0 < 0 = região 1) | 011) 


V (constante) G > 0 = região 2, 


Podemos tomar V > 0. 


Fig. 10.2 Degrau de potencial como limite 


Fig. 10.3 Movimento clássico num degrau 
de potencial 


Podemos pensar em V(x) como limite 
de um potencial V (x ) em que a transição 
entre os dois valores da (10.11) se dá de 
forma contínua, numa região 
-e<xx<e(e>0), quandoe 4 0 
(fig. 10.2). A força clássica 


F)=-— (10.12) 


é o limite da força F (x), e representa (fig. 
10.2) uma força impulsiva, que no limite é = 
Opara x=U es -s p/x=0. 


Na mecânica clássica, a força F(x) < 0 
tenderia a reduzir o momento p de uma 
partícula que se movesse da esquerda pa- 
ra a direita, no momento de sua passagem 
pela origem (desaceleração), se a energia 
E da partícula é> V [fig. 10.3(a)]. O mo- 
mento da partícula nas regiões 1 e 2 é da- 
do nesse caso por 


= HE pi = fon V< (0.13) 


Se E> V lfig. 10.3(b)], a origem é um ponto de retorno: a partícula, vindo da 


região 1 com p > 0 , será “totalmente refletida” em x 


Fig. 10.4 Análogo ótico do degrau 
de potencial 


0. 

Do ponto de vista da analogia com a ótica, 
no caso (a), teríamos um índice de refra- 
ção relativo nn = p2/p; < 1. e uma onda 
incidente vinda da região 1 seria parcial- 
mente refletida e parcialmente transmitida. 
No caso (b). como nas (10.9) e (10.10). 
haveria reflexão total, mas com uma onda 
evanescente (exponencialmente atenuada) 
no meio 2 (Coticamente menos denso”). 
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Vejamos agora o que acontece na mecânica quântica. 


Nesse caso, a equação de Schrödinger (10.4) nas regiões 1 e 2 fica 


| m a a A a E | 
(10.14) 
feodau- tet b= 
goo Sos ú 
com as soluções gerais 
q E)=Ai™ +B 
TO) (10.15) 


qo (x)= Cet + Det 


Para definir uma solução, temos de especificar condições de contorno, tanto no 
infinito (x —> + œ) como na origem (x = 0), onde V(x) é descontínuo. 


Condições no infinito 


Como na mecânica clássica, podemos ter uma partícula (ou feixe de partícu- 
las) incidente da esquerda para a direita (neste caso D = 0) ou vice-versa (neste 
caso 4 = 0). O caso geral é uma superposição dos dois, e basta considerar o 1.º 
caso, em que A é dado e B e C têm de ser obtidos: 


-ika 


o ()= 40% +Be 
es E ay 

incidente refletido 
(10.16) 


| 


2(2)=Ce'™ (transmitido 
@3 
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O fato de haver duas soluções independentes com a mesma energia E (uma 
com D = 0 e outra com A = 0) corresponde à mesma dupla degenerescência já 
encontrada para partículas livres: a possibilidade de movimento em dois sentidos 
opostos. 


Condição de contorno em x = 0 


O potencial V(x) é descontínuo em x = 0. 
Por outro lado, como a solução é estacionária, a (10.1) dá 


E E) p 3 2 
Zee- Zle -lOl -o (017) 


ou seja, a densidade de probabilidade é independente do tempo (estacionária). 
Se tomarmos então, na (9.57), x» =€ , x) = — €, com € > O arbitrariamente 
pequeno, vem 


-3 fo@)ar=0= j6) je) 


ou seja, fazendo € 40 (por valores positivos), 
i60,0)= j0) (10.18) 


A corrente de probabilidade deve permanecer contínua na origem, apesar da des- 
continuidade do potencial (por mais forte razão, isto vale em V outro ponto x). 
Isso implica, pela expressão de j, 


9: (0) = p: (60) 
3 3 (10.19) 
SE o) = SGo) 


ou seja, a função de onda e sua primeira derivada em relação a x devem ser 


contínuas. 
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Pelas (10.16), isso dá 


A+B=C 


ih(A-B)= icfa- = 


o que leva a 


B _ k-k 
E A E A = amplitude de reflexão | 
| (10.20) 
à | 
£ pe amplitude de transmissão | 
+ | 


Pela (9.58), as correntes incidente, refletida e transmitida são dadas por [cf. 
(1016): 


P ja A4Bfo. jm =|Cf» (1021) 


onde v = Ak/m (j = 1,2). Na interpretação em termos de feixes de partículas, as 
correntes são proporcionais aos números por unidade de tempo de partículas inci- 
dentes. refletidas e transmitidas, respectivamente. Logo, as probabilidades de re- 
flexão (r) e transmissão (t) são dadas por 


(10.22) 


e as (10.20) dão 
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(10.23) 
que satisfazem a 
| 1 (10.24) 
conforme deveria ser (soma das probabilidades — 1). 
Em termos do “índice de refração” relativo 
(0.25) 
a (10.23) dá 
E M 
E gas (10.26) 
tel (n+1) 


que são idênticos à refletividade e à transmissividade de uma interface entre dois 
meios transparentes na incidência L [cf. (5.72)] 

Temos então um efeito tipicamente quântico, consegiiência das propriedades ondu- 
latórias das partículas: na mecânica clássica, uma partícula com E > V é “totalmente 
transmitida”, ao passo que quanticamente cla tem uma probabilidade > O de ser refletida 
(embora tenha energia suficiente para ulirapassar o degrau de potencial). 

Em particular, se for (E — V) << V, ou seja, se a energia estiver muito pouco 
acima do topo do degrau, a (10.14) mostra que será p: << p; (a partícula é forte- 
mente desacelerada pelo degrau, na mecânica clássica) e a (10.23) > r = 1, ou 
seja a reflexão é quase total, situação típica para uma onda numa descontinuidade 
forte (para E >> V, temos r — 0: a partícula quase não é afetada pelo potencial). 


G)ose<v, 


Nesse caso, a solução anterior continua valendo, mas temos de tomar. na 
(10.14) [cf. (10.9)], 


p= Pr OD ju) (1027) 


de modo que a 2.º das (10.16) dá 
paci =c" (r>0) 


Mas o sinal inferior é inaceitável, pois corresponde a um crescimento exponencial 
para x > œ. Logo, 


b=ilbl, pE) = Colt = ca rta (10.28) 
que corresponde a uma onda evanescente. 
A (10.20) dá 
B h=bl om na! tel | ido 
A krili] É | uu: 


(o quociente de dois complexos conjugados é um fator de fase). Substituindo na 
(10.22). 


ll 2 | 
| 


Ir=|ž] = (10.30) 
| Ai 


ou seja, temos neste caso reflexão total, como na mecânica clássica. 
Levando a (10.29) na (10.16), obtemos 


p Q= a| 48200] aen [260 + este) 


E o s 


ou ainda, como Qı (0) = œ (0), 


(10.31) 


mostrando que a solução na região 1 é 
uma onda estacionária (interferência en- 
tre incidente e refletida), que penetra na 
jo região 2 (fig. 10.5) como uma onda eva- 
| nescente, análoga às que encontramos na 
reflexão total (Seç. 5.10). A profundidade 
de peneiração é da ordem de 


Fig. 10.5 Penetração na região proibida 


1 h 


lel fome) (sa) 
tanto maior quanto mais próxima estiver a energia do topo do degrau, E = V. 

Temos portanto uma probabilidade < O de que a partícula seja encontrada na 
região classicamente proibida, E < V. Esse é um efeito tipicamente ondulatório. 
Como na reflexão total, a solução estacionária não permite ver como ocorre a penc- 
tração na região proibida: para isto, teríamos de construir um pacote de ondas, 
superpondo diferentes energias (incluindo soluções com E > V, para as quais a re- 
gião é permitida). 

Observamos ainda que, para E < V, não existem soluções com partículas inci- 
dentes da região 2 para a 1, de modo que, neste caso, os autovalores da energia não 
são degenerados. 


Limite de parede impenetrável (V > œ) 


Se fizermos V — ce, a (10.32) mostra que a profundidade de penetração > 0, a 
(10.28) que q: (x) > 0, e a (10.29) que B/A > — 1 (n > 1/2), de forma que 
as (10.16) ficam 

Qı (x) = 2iAsen (k; x) 


(10.33) 
O 
(x) correspondendo à condição de contorno 
v(o)=0 (10.34) 


associada a uma parede impeneirável 
(fig. 10.6). Nesse caso limite, a derivada 


Fig. 10.6 Parodo impenetrável dwW/9x é descontínua na origem. 
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10.3 Particula confinada 


Na Seç. 10.2, ilustramos soluções dos tipos E; e Ez da fig. 10.1, corresponden- 
tes a movimentos ilimitados, característicos de processos de espalhamento, em que 
a energia tem um especiro contínuo. 

Vamos ver agora um exemplo simples de solução do tipo E:, em que o movi- 
mento da partícula é confinado a uma região limitada do espaço: classicamente, é 
um movimento oscilatório. 


(a) Particula numa caixa unidimensional | 


Vê) Corresponde ao potencial 


5 
RNAS RAS 
i 
> | 
= 
ln į 
A 
kal 
A 
Eis, 


(10.35) 


Fig. 10.7 Caixa de paredes impeneiráveis ilustrado na fig. 10.7. 


Na mecânica clássica, poderíamos pensar numa bolinha que oscila entre duas 
paredes impenetráveis. colidindo e sendo totalmente refletida por cada uma delas. 
A largura da caixa é a. 

Do ponto de vista de ondas clássicas, temos propagação entre duas paredes 
totalmente refletoras. 


A função de onda q (x) só é + O dentro da caixa, onde satisfaz 


La 7 . s 
kam EN ea (15155) (10.36) 
| 2 


=0 (10.37) 


A solução geral da (10.36) é 
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of) = Aet + Bete (10.38) 


Para aplicar as (10.3 onveniente introduzir a notação 


(10.39) 


As (10.37) ficam então 


(10.40) 


Para que esse sistema homogêneo nas incógnitas A e B tenha solução não-trivial, 


tem de ser 


et te = Disen (ka) | (1041) 
ii 


(10.42) 
pois a = 0 daria ọ (x) = 4 + B = 0, solução trivial. 
Logo, 
E a | 
inx/2 par) 
p= SA | 10.43 
| gi (x ímpar) | É ) 


Para n par, z é real, de modo que as (10.40) dão, juntamente com a (10.38), 


arz=of a= g6) a[ ) 
Ja-B=o{a= B] oG) afe ee) 


e n ímpar, z 
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Finalmente 


= 
ny 


(10.44) 


no (9) = Np cos (k, > MIC E ə 


5 RR A (x) = N; sen (k, x)| 


a 


= 
il 
X” 


onde N, e N,’ são fatores de normalização; valores negativos de n não dão auto- 
funções novas. 


Pela (10.36), os autovalores correspondentes da energia são 


(10.45) 


Propriedades das soluções 


G) Espectro discreto 


Na mecânica clássica, uma partícula poderia oscilar entre as paredes com qual- 
quer energia E 20. 


E 
A 
E [-—— E, 


Quanticamente. o espectro de energia é 
discreto: a energia é quantizada, podendo 
assumir somente os valores (10.45), que 
dão os níveis de energia da partícula (fig. 
EM 4, 10.8). Para cada nível, há uma só auto- 
função independente, ou seja, os níveis 
são não-degenerados. 

O espectro discreto é característico 
E do confinamento. 


Fig. 10.8 Níveis de energia da particula confinada 
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Gi) A “energia de incerteza” 


A energia mínima que a partícula pode ter (estado fundamental) é 


(10.46) 


Vamos ver que essa energia mínima está associada ao princípio de incerteza. 


Com efeito, as paredes impenetráveis confinam a partícula à região Ixl < a/2, de 
forma que a incerteza na posição da partícula é 


Ax<a (10.47) 


Pela relação de incerteza, isso implica numa incerteza em momento 


= d 
Ap | 
PE sa | (10.48) 


e numa energia mínima (a energia da partícula é puramente cinética) 
DADE ss 4 
A R? 
| CD o É (10.49) 
2m 


8ma? 


A (10.46) é dessa ordem de grandeza 
ser pensada como “energia de localização” ou “energia de incerteza”. Note o ca- 
ráter “positivo” da relação de incerteza. 


Logo, a energia do estado fundamental pode 


to (iii) Autofunções 


As (10.44) mostram que as autofunções 
(fig. 10.9) são idênticas aos modos nor- 
mais de vibração de uma corda vibrante 
| presa nas extremidades (Fís. Bás. 2, Seç. 


5.7), que satisfazem exatamente à mesma 
eq. (10.36) e às mesmas condições de 
4 contorno (10.37). 

O caráter discreto do espectro de os- 
cilações é característico das ondas confi- 
nadas (membranas vibrantes, cavidades 
ressonantes): é uma propriedade ondula- 
tória. Como de Broglie havia observado, 
essa é a origem dos números inteiros nos 


Fig. 10.9 Autofunções da particula confinada autovalores da energia. 
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(iv) Número de nodos 


Não contando os nodos (zeros) nos extremos + a/2 , vemos que a função de 
onda do estado fundamental (n = 1) não tem nodos: para o estado E, , que É o 
(n — 1) — ésimo estado excitado, há (n — 1) nodos. 

Intuitivamente, a razão desse resultado é que funções de onda com mais nodos 
oscilam mais, portanto têm momento (proporcional ao gradiente) e energia cinética 
mais elevados. 


(v) Paridade 


Com a escolha de origem que fizemos, o potencial (10.35) é uma função par 
de x: 


v&)= ve) i (10.50) 


Como 2/0x? não se altera pela transformação x —> — x, o mesmo vale para o 
hamiltoniano 


At)=A() (0.51) 
Logo. 
Bo)=Eo()=> Bo, C) = Ep; (x) (10.52) 


ou seja, Qs (~x) é uma autofunção associada ao mesmo valor E da energia. 


Como as autofunções, nesse caso, não são degencradas, isso implica 
Pr C) =A: Q) (10.53) 


onde À é uma constante. Trocando x por —x, vem: ge (x) = Agr (=x). e, substi- 
tuindo na (10.53). 


pr) = pr Ca) [RN =1 {=H (10.54) 


Levando na (10.53), 


o; E + (10.55) 

Logo. as autofunções têm paridade definida. isto é, são necessariamente pares 
ou impares, como consegiiência da invariância do hamiltoniano na transformação 
(10.51) (x —> — x) . Efetivamente, na (10.44), n ímpar leva a autofunções pares 


en par a autofunções ímpares | Q: (~x) =— P, (x)]}- 


(vi) Orionormalidade e “completeza”. 


Para calcular os fatores de normalização nas (10.44). usamos a condição de 


normalização: 


ei | 
E “o 


que leva a 


(10.56) 


de modo que 


| 
| 
| (10.57) 
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formam uma base ortonormal de funções (completa) no intervalo (-a/2 , a/2), 
permitindo que qualquer função q (X) quadraticamente integrável (normalizável) 
que se anula nos extremos desse intervalo possa ser expandida sob a forma 


Ko- E So corta t taei Tiy (2e) (10.58) 


as 


onde os coeficientes de expansão a, e bn se calculam projetando sobre os vetores 
da base 


Ina aldan- E Troa] 


la 
| 
d 


(10.59) 


[E E Í oG) sen[ 2 Zaļa 


| 
pe 


Do ponto de vista matemático, a (10.58) representa uma expansão em série 
de Fourier, e as (10.59) dão os coeficientes de Fourier dessa expansão. Trata-se de 
uma generalização ao espaço de Hilbert (dimensão infinita) da representação de um 
vetor em termos de suas componentes em eixos ortogonais. 


[©) Partícula sobre um aro circular | 
Como segundo exemplo de movimento confinado, vamos considerar um 
sistema quântico que seria o análogo de uma partícula clássica vinculada a se mo- 
ver sobre um arco circular (fig. 10.10) de raio a (como uma conta que desliza 
sobre um aro) 


A coordenada que corresponde a x é 


(10.60) 


o arco de círculo descrito pela partícula 
após percorrer um ângulo 6 a partir de 
Fig. 10.10 Particula num aro circular uma direção fixa. 
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Por conseguinte, o que corresponde aqui ao operador momento é 


(10.61) 


Supomos que, além do vínculo, nenhuma outra força atua sobre a partícula, de 
modo que o hamiltoniano é o de uma partícula livre ao longo do círculo, 


(10.62) 


O sistema, nesse sentido, ainda é unidimensional, mas a diferença com a reta 
é que a circunferência se fecha, confinando a partícula a uma região finita. Embora 
1,$2,...) cor- 
respondem ao mesmo ponto do espaço, de forma que podemos impor uma condição 


ġ possa crescer indefinidamente, os pontos be b + 2jx (j= 


de periodicidade à função de onda: 


[ É x A 
keza- vO O (10.63) 
Procuremos inicialmente os autovalores e autoestados do momento p é 
Po Wo (6) = (8) (10.64) 


onde estamos chamando de À os autovalores. Pela (10,61), a (10.64) equivale a 


ih 3y RN (2e 
Es A = Ay = E 
a db a i dd h Ju 


o que dá a solução 


y, (0)=N exp (Z5) (10.65) 
7 


N sendo um fator de normalização. 
A condição de periodicidade (10.63), com j = 1, dá 


ata confinada 377 


Priha) (6) = G) 


Wi (O + 27) = exp ( 


2rika 
ep 


levando aos autovalores 


Ro) 


(10.66) 
e às autofunções (já normalizadas) 
Dão y e a Sail 
w (o) @ = 0,41.. (10.67) 
L 


que obviamente satisfazem à condição de periodicidade. 


Momento angular 


Se tomarmos um eixo Oz perpendicular 
ao plano do círculo, passando pelo centro 
(fig. 10.11), podemos definir o operador 
momento angular da partícula em rela- 
ção ao eixo Oz, por analogia com a me- 
cânica clássica, como 


(10.68) 


Fig. 10.11 Momento angular 


e a (10.67) dá 


(iu, (D=nhy, (0) (=0+1,..) (10.69) 

Logo, as autofunções de Po são também autoesitados do momento angular t e 

vemos que o momento angular é quantizado em unidades de h (caso especial de 

um dos postulados de Bohr): a quantização (espectro discreto) aparece aqui como 

consegiiência direta do confinamento a uma região finita, expresso através da con- 
dição de periodicidade da função de onda no ângulo 6 . 
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Finalmente, como, pelas (10.62) e (10.68) 


x 1 p 


A 
os autoestados de |. também são estados estacionários, com 


iz 1 
Eu) 


(10.71) 


onde os autovalores da energia, como consegiiência do confinamento, formam um 
espectro discreto, 


És 
E = zn (10.72) 
2ma 
com 
EE, (10.73) 


ou seja. cada nível de energia é duplamente degenerado (exceto n = 0), com as 
duas autofunções independentes Ya e Wa. 

Fisicamente, essas autofunções, correspondem aos dois sentidos opostos de 
percurso do círculo (como p e —p ao longo da reta). 


Podemos entretanto substituir y, e W-» por duas combinações lineares inde- 
pendentes. Em particular, 


Y, Yp, o cos (0) | 
(10.74) 


œ sen (z0) 


permitem defir inir outro conjunto equivalente de autofunções de À, que não são au- 
tofunções de Do nem de A Se as tomarmos dessa forma, elas terão nodos ao longo 
do círculo (0 < é < 27), cujo número aumenta com a energia do nível, de forma 
análoga ao que encontramos para o confinamento entre duas paredes impenetráveis. 
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10.4 Barreira de potencial retangular 


AVC) Consideremos agora o potencial unidi- 
| E mensional 


f 0 (x < =segião 1 
E v(d)= V>0(0<x<a)=região 2, 
| 0 (x > 0)=região 3 | 


(10.75) 


Fig. 10.12 Barreira retangular 


Temos duas situações possíveis: E = E’ > Ve 0< E” < V; em ambos os casos. 
vamos considerar estados estacionários com uma partícula (ou feixe) vindo da 
esquerda (fig. 10.12). e discutir a probabilidade de transmissão para a região 3. 


E 
| a)E >V 


Vamos introduzir as notações [cf. (10.14)] 


h=mE/h dio 
| k= 2m(ŒEŒ-V)/ħ=nk i 


As soluções nas regiões 1, 2, e 3 são análogas às que vimos para o degrau de 
potencial: 


mej- ad + Bete | 


Q ()= Celt + Det 


| 


| 
| (10.77) 
| 
| 


onde a amplitude de transmissão T , que estamos interessados em calcular, é de- 
finida por 


(T=E/A] (10.78) 
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pois A é a amplitude da onda incidente. 


Temos agora dois pontos onde aplicar as condições de contorno: x = 0 e 
x= a, com 
Vamos introduzir as notações 
ii (10.79) 
As condições de contorno dão então: 
| i | 
| p= >4A4+B=C+D 
[E o (10.80) 
do dy k | 
<A dh sa -B="(C-D=n(C-D 
| dx dx ko ( p= ) | 
e 
F q 
| $ 
ai, (10.81) 
EL E E E, 
dx dx d n 


As (10.81) permitem exprimir C e D em função de E: 
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(10.82) 


Por outro lado, as (10.80) dão: 


i= [e + i)e -(» z o] (10.83) 


e, pelas (10.82). 


Kaj 


ou, pelas (10.79), 


(10.84) 


Esse resultado tem uma interpretação física imediata. Lembrando as ex- 
pressões (10.26) da refletividade r c transmissividade 7 do degrau de potencial, a 
(10.84) se escreve 
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Y | 
(n-1)aga 
Ts EA dE =|) 4=2ka] (10.85) 
a ordt 


o que corresponde aos resultados obtidos na ótica quando discutimos as franjas de 
interferência numa lâmina de faces paralelas (Seç. 3.4). 


Com efeito: o denominador 1 — re”. 


+ onde r é o produto das amplitudes de 
reflexão nas duas interfaces (lembrando que a interface reflete igualmente bem dos 
dois lados) e A a defasagem para atravessamento duplo da lâmina, neste caso cor- 
respondendo ao que seria incidência L na ótica, é exatamente o mesmo encontrado 


na (3.34), representando a soma de todas as multi-reflexões internas. O numerador 


contém +, o produto das amplitudes de transmissão para entrar e sair da lâmina, e a 


inclina associada ao atravessamento da lâmina. 


defasagem e 
Podemos portanto aplicar aqui a discussão dos efeitos de interferência dada na 


Seg. 3.4. Teremos para a probabilidade de transmissão T (total) 


(10.86) 


(10.87) 


Como na Seç. 3.4, 


probab. de transmissão = 1 


ka=jn(A=2jn(interf. construtiva) { $ = sk =1 


mas. 


+ E {A = (2 j + 1)n Qinterf. destrutiva) { T = Sã = 


j inteiro 


(10.88) 


Na ótica, o índice de refração depende em geral da frequência œ (dispersão). 
Aqui, analogamente, é preciso levar em conta que k depende da energia E . Pela 
(10.76), 


ta=[lm(E-V) (10.89) 


Embora tenhamos tomado uma barreira 
na (10.75), a solução também se aplica a 


estados com E > 0 para um poço de po- 
tencial rerangular (fig. 10.13), bastando 
substituir 


VS (10.90) 


tomando sempre V > 0. O índice de re- 


Fig. 10.13 Poço retangular fração fica 


| | (10.91) 
e, pela (10.26), 
JEZV -JE) 
Da 10.92) 
Ná (EE) É j 


Vimos na ótica que os picos de transmissão tornam-se estreitos quando 7 é 
muito próximo de 1. Pela (3.37), a semilargura de um pico é da ordem de 


2e=2(1 5) (10.93) 


A (10.92) mostra que r é próximo de | nas seguintes situações: 


(Ë) Barreira, 0 < EPE e (pouco acima do topo) | 


| Qi) Poço, 0<E<<V | 


(10.94) 


Analogamente. pela (10.88). os mínimos de transmissividade são proporcionais 
pt- ry; que é pequeno nas mesmas situações (10.94). 

Pelas (10.88) e (10.89), os máximos de transmissão correspondem a energias 
E; tais que 


ou seja 


(10.95) 


e) (=1,5 


Como o 2.º membro cresce com py . as (10. 94) só podem em geral ser satisfeitas 
para os valores mais baixos de j . Para E >> V, os picos tornam-se muito largos e 


o contraste entre máximos e mínimos é pequeno. 


TÀ O andamento típico de F como função de 
1.0 F E para o caso de um poço está represen- 
tado na fig. 10.14. Em contraste com o 
caso da ótica (Seg. 3.4), não há periodici- 
dade em E e as franjas vão ficando cada 
vez mais largas e menos nítidas. O caso 
da barreira, com E > V, é análogo. 

Os picos mais estreitos, para os va- 
lores mais baixos da ener; 


são chama- 


dos de ressonâncias de transmissão. Qual 


é a razão desse nome? 


E ‘k Nu limite cin que se tivesse r = 1 (ue 
flexão total nas interfaces x = 0 e x = a), 
Fig. 10.14 Transmissividade em função da energia os máximos de transmissão em 


o 


(10.96) 


corresponderiam aos níveis de energia discretos (10.42). 
Logo, os picos podem ser considerados como um fenômeno de ressonância 


com essas energias, da mesma forma que as ressonâncias de um tubo de órgão na 
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acústica, p. ex. (Fís. Bás. 2, Seç. 6.4): a fregiiência das “oscilações forçadas” coin- 


cide com a das “oscilações livres”. 


Para um poço, podemos pensar nas 
ressonâncias como um prolongamento 
ao espectro contínuo do espectro dis- 
creto de níveis de energia ligados (fig. 
10.15 
sonante tem uma largura A E em ener- 
x gia correspondente à (10.93) para os 
níveis estreitos. A origem dessa lar- 
gura é a transmissão para a região ex- 
terna [e = f na (10. 93)], como seria a 
extremidade aberta no caso de um 


no contínuo, cada “nível” res- 


tubo de órgão. 


No espalhamento de elétrons de baixa 
energia (E ~ 0,1eV) por átomos de 
Fig. 10.15 Ressonâncias como níveis virtuais gases nobres (Ne, Ar). observam-se 
ressonâncias de transmissão: para determinadas energias, os átomos comportam-se 
como se fossem praticamente transparentes aos elétrons. Esse fenômeno, conhecido 
como efeito Ramsauer, é análogo ao que acabamos de discutir, mas seu tratamento 


adequado requer a teoria do espalhamento tridimensional. 


| ©) 0 < E < V :Tunelamento (barreira) | 


Esse caso corresponde à energia E” na fig. 10.12. Como na (10.27) para o 
degrau de potencial, a solução anterior permanece válida, bastando tomar 


=ibl=iPmW-E)/h=ik (K>0) | 10.97) 


A 2. eg. na (10.77) fica então 


pesce be (0<x<a)| (10.98) 


mas aqui, ao contrário do degrau, não se pode excluir a exponencial crescente, 
porque x não se estende até + œ (região finita). 
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Como na (10.9), também o “índice de retração” se torna imaginário: 


[Ed dd SEI E m>). (10.99) 


A (10.85), com essas substituições, fica 


| 4im 
A E 
ER n+b. 
Teg REA «| (A ) (10.100) 
| | EN 1) coa | 
fa 
| in+l 

Vamo-nos limitar a uma “barreira espessa”, supondo 

Ka >>1 | (10.101) 

-2Ka 


pois podemos então desprezar o termo em e 
que leva a 


no denominador da (10.100), o 


aka 
(10.102) 
i] 
Pelas (10.97) e (10.99), 
v v J =e | R 
T mad al 2 (10.103) 
da El 


Classicamente, uma partícula com E < V não poderia penetrar na região 2 
(proibida): sofreria reflexão total. Quanticamente, a partícula pode “tunelar” atra- 
vés da barreira : a probabilidade de transmissão (10.102) - (10.103) é pequena, mas 
= 0. 

Esse efeito de iunelamento é tipicamente ondulatório, análogo à reflexão total 
frustrada (Seç. 5.9). Quanto mais cstreita a barreira e/ou mais próxima estiver a 
energia E do topo V da barreira, maior a probabilidade de tunelamento. 
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10.5 Estado furdaner 


O tunelamento quântico se manifesta nu- 


Hepulsão ma grande variedade de fenômenos. Uma 
coulombiana 
das primeiras aplicações foi a teoria de 
G. Gamow da desintegração alfa, em que 
um núcleo de n.º atômico Z e n.º de mas- 
sa A emite uma partícula œ (núcleo de 
— 3 
He): 
E (Ea)5(-2,4-4)+a| (10108 
Atração [SE A, e 
nuclear 


O modelo de potencial | iridimensional: 
V = V (Çr) ] está ilustrado na fig. 10.16: a 
partícula œ, de carga +2e, precisa 


Fig. 10.16 


lelo de Gamow 
da desintegração alfa 
vencer a barrcira coulombiana de carga 


(Z — 2)e, do núcleo residual, por tunelamento. A grande sensitividade da exponen- 
cial na (10.103) à variação de V — E explica por que as meias-vidas para desinte- 


ção q. variam desde ~ 107s até > 10º anos 


“a frio” de elétrons de 
ão e de tunela- 


Outras aplicações são a emissão de campo, a em 


um metal sob a ação de um campo elétrico; microscópios de emis 
mento, tunelamento em semicondutores, etc 


10.5 Estado fundamental do átomo de hidrogênio 


Como exemplo importante de um estado ligado tridimensional, vamos tratar o 
estado fundamental do átomo de hidrogênio. 

Temos nesse caso um problema de dois corpos (próton e elétron), com seis 
graus de liberdade espaciais (as três coordenadas de cada uma das duas partículas). 
A equação de Schrödinger seria uma “equação de ondas” num espaço 6 dimen 
sional (para n partícula 


„3n — dimensional), mostrando que interpretações “intuiti- 


v 


da mecânica quântica em termos de propagação de ondas exigiriam uma “in- 
tuição multidimensional”. 


Entretanto, como no problema clássico de dois corpos com forças centrais, é 


possível separar o problema em termos do movimento do centro de massa e do 
movimento relativo, este descrito pelo potencial coulombiano (central); o CM se 
comporta como uma partícula quântica livre de massa igual à massa total. 

Interessa-nos a equação de Schrödinger para o movimento relativo, que é a 
equação de Schrödinger tridimensional para o potencial coulombiano, associada a 
um estado estacionário de energia E: 


(10.105) 


onde, como na (7.34), 


(10.106) 


Se, 


Na (10.106), como no problema clássico de dois corpos, m deveria ser a massa 
reduzida (Fís. Bás. 1, Seç. 10.10) do sistema elétron-próton, dada por 


(10.107) 


Como mp/me >> 1 (-2 x 10) + porém, m = Me , a massa do elétron [ mas a 
precisão espectroscópica requer o uso da (10.107)1. 

Para estados estacionários ligados (com o zero de energia correspondendo a 
r> œ), temos 


(10.108) 


e temos de procurar soluções normalizáveis da (10.105), que só existem para valo- 
res discretos de E (autovalores), os níveis de energia do H. 

A solução geral da (10.105) depende das 3 coordenadas (7,6,0) do elétron 
em relação ao núcleo. A dependência de 8 e O é dada por funções que em geral têm 
caráter oscilatório, e por conseguinte têm nodos. como as (10.74). Como esperamos 
que a energia cresça com o n.º de nodos, como nos exemplos vistos, e só estamos 
interessados no estado fundamental (de energia mínima), procuraremos uma 


solução independente de 8 e b (7. sem nodos na dependência angular): 
— 
e=) (10.109) 
Daí decorre 


(10.110) 
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e, usando a identidade (9.85). 


ri 
sq = avo) = Z2 aveir: v(1 48) o) 
d r dr 
divr= 02407, 02 0 
dx x z 


y1 2e) ra 149) r| 1 dp ito 
rdr) rdrlrdr) FL? dr rar 
d d 2d 3 
levando a 


dọ] 
dr | (00D 


349 Ido dor foz 
Me rer ar USO eT 


o que também pode ser obtido calculando ð 2,0x2,92/097,92/8277. 
Levando esses resultados na equação de Schrödinger (10.105), resulta 


hº [a 24 
-EER- 240) 4 =| aids 
| e dm 


Seja 


(10.114) 


(10.115) 
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A (10.113) fica então 


-G-K 9=0 (10.116) 


da qual temos de encontrar uma solução normalizável para determinar o autovalor 
K [que dá a energia, pela (10.114)]. 
Para r > «o, a (10.116) deve reduzir-se a 


a 
dr 


P-Kg=-0[0 540" + Be” (><) 


onde K 
malizável), de forma que temos de ter B = 0. Podemos procurar então uma solução 
tentativa sem zeros (nodos) da forma 


+ NK” (> 0). Mas o 2º termo é uma exponencial crescente (não-nor- 


o(r)= net” (10.117) 
o que dá dy/dr = — Kọ. Levando na (10.116), vemos que ela é satisfeita se 
tomarmos 
K=1/a (10.118) 
o que pela (10.114), leva ao autovalor 
pe | 
=>] (10.119) 
2ma | 


que é a energia do estado fundamental do áromo de hidrogênio. já obtida na 
teoria de Bohr [cf.(7.52)]. Aqui, porém, é um resultado exato da mecânica 
quântica. 

Resta calcular o fator de normalização N na (10.117). Devemos ter, dada a 


simetria esférica, 


1s jjo} r= ajlo Par=am|nf Jer Pdr 
o 9 


-2Kr 
= 1 Ee É $ 
2K 2K}; 
=0 
ou seja, pela (10.118), 
a ap E SE. (10.120) 
4K? (7/0) äi 
o que dá, finalmente, pela (10.117), 
f) - (10.121) 


A probabilidade de encontrar o elétron entre r e r + dr, ou seja, dentro de uma 
casca esférica de volume 4t r? dr com centro no núclco (próton) é 


Ofar t Ag Pa dr (10.122) 
do 


idP=4nr 


A densidade de probabilidade d P/d r é máxima para 


fis tf ) 22r eln Zpen nare] 
dr é a 


ou seja, para 


(10.123) 


A fig. 10.17 ilustra o andamento da 
densidade de probabilidade radial. 
Vemos que é máxima para uma disiân- 
cia do núcleo igual ao raio de Bohr. 
Entretanto, longe de termos uma órbita 
circular plana com este raio, temos 
uma “nuvem de probabilidade” esferi- 


camente simétrica, cuja densidade cai 


exponcncialmente para r >> ap, onde 


Fig. 10.17 Densidade de probabilidado radial 


o raio de Bohr corresponde à distância 
mais provável do elétron ao núcleo. 


O valor esperado do raio atômico é {r} = à ag (Probl. 4). 


Relação com o princípio de incerteza 


Para um elétron à distância r do núcico, a energia potencial é 


r= (10.124) 


Por outro lado, um elétron confinado dentro de uma esfera de raio r possui, pelo 
princípio de incerteza, uma energia cinética mínima 


(A [DA K E 
12: 
Fa) Dis” IMF pO 
ou seja, uma energia total 
E()- rev e (10.126) 


Para r DE co. Para r o, E 0, por valores negativos (V domina 
em relação a T ). Logo, E (r) deve passar por um mínimo, o que acontece para 


2 2 af 2 2 
EE tela / mg 
dr mr F Pk r 


al (10.127) 
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S 
a 
a 


Logo, a energia do átomo de hidrogênio no estado fundamental é a energia 
mínima compatível com sua localização (“energia de incerteza”). 


Estados excitados têm nodos (Probl. 9), o que aumenta a energia cinética. 


Momenio angular 


O operador quântico (vetorial) associado ao momento angular é definido por 
extensão da mecânica clássica (princípio de correspondência): 


(10.128) 


Resulta então da (10.110) que, para qualquer função de onda esfericamente 
simétrica, 


= 5 do | 
t) -iħñrxVo(r) trai e=] (10.129) 


ou seja, simétria esférica corresponde a momento angular zero. Diz-se que a fun- 
ção de onda é nesse caso uma onda s. 

Temos aqui outra diferença entre o estado fundamental do hidrogênio na me- 
cânica quântica c na teoria de Bohr [nesta, o estado fundamental tinha momento 
angular =  : cf.(7.50)] 

Para obter os estados excitados do átomo de hidrogênio; é preciso desenvolver 
a teoria quântica do momento angular no caso geral, o que se faz em cursos mais 
avançados de mecânica quântica. 


10.6 Spin e Princípio de Exclusão 


Além do momento angular orbital (10.128), o elétron tem também um mo- 
mento angular intrínseco, como o fóton, associado à polarização. Para o fóton, 
como vimos na Seç. 8.9. a projeção do momento angular intrínseco sobre uma dada 


dire 
o fóton tem spin 1 (momento angular intrínseco medido em unidades de fi). 


(a direção em que ele se propaga) tem autovalores + h. Dizemos então que 


No caso do elétron. que é, ao contrário do fóton, uma partícula carregada, o 
spin dá origem a uma propriedade característica da rotação de uma carga (embora 
não se possa pensar no elétron como se fosse uma espécie de giroscópio carre- 
gado): a existência de um momento de dipolo magnético intrínseco, como um imã 
microscópico. 
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Em consegiiência dele, um feixe de elétrons é afetado por um campo mag- 
nético inomogêneo, como dipolos elétricos se deslocam num campo elétrico inomo- 
gêneo (Fís. Bás. 3, Seg. 4.5). Uma experiência realizada por O. Stern e W. Gerlach 
em 1921, fazendo um feixe atravessar um campo B fortemente inomogênco, mos- 
trou que o feixe se divide em duas componentes. associadas a doi 
possíveis da projeção do spin na direção de B: + A/2 e — R/2. Em 1925, G. 
Uhlenbeck c S. Goudsmit propuseram a idéia de que o elétron é uma partícula de 
spin 1/2. 


únicos valores 


Assim, na mecânica quântica não-relativística, o elétron deve ser descrito não 
apenas por uma, mas por um par de funções de onda (vetor coluna de duas compo- 
Uma repre- 
sentação desse tipo foi proposta por W. Pauli. Portanto, uma descrição completa do 


nentes), para incluir os efeitos de seu spin (polarização intrínseca) 


estado de um elétron é dada por um vetor de estado que também inclui a descrição 
da polarização (spin). 

Uma partícula de spin 1/2, como o elétron, obedece a um novo princípio da 
física quântica, também formulado por Pauli, o princípio de exclusão: 2 elétrons 
(mais geralmente, duas partículas de spin 1/2 ) não podem ocupar o mesmo estado 
quântico. Por exemplo. não podem ocupar a mesma posição r e ter spins (17) pa- 
ralelos (mesma polarização): podem ocupá-la se tiverem spins (TJ) antiparalelos 


(polari: 


ções opostas). O mesmo se aplica a dois elétrons de mesmo momento p. 

O princípio de exclusão tem consegiências extremamente importantes, quando 
consideramos átomos com mais de um elétron. Assim, no átomo de He, que tem 
dois elétrons, ambos podem ocupar o mesmo nível de energia no estado fundamen- 
tal, um estado s análogo ao do hidrogênio, mas para isso devem ter spins opostos 
ah 

Por outro lado, para o Li, que tem 3 elétrons, o 3.° elétron não pode mais 
ocupar U mesmo estado tipo hidrogênio dos outros 2: tem de ir para um estado 
mais excitado, onde tende a estar mais distante do núcleo. Por conseguinte, esse 
elétron está mais fracamente ligado, e deve ser mais fácil ionizar o Li que o H. 

Com efeito, a energia de ionização do H, 
é de 24,6 eV : a do Li é de 5,4 eV 


Do ponto de vista químico, o He é um gás nobre, com reatividade muito bai- 


como vimos, é de 13,6 eV. A do He 


xa. Seus dois elétrons formam uma camada fechada (camada K). Já o Li é um 
elemento alcalino, com forte reatividade química, que transfere facilmente seu elé- 
tron mais externo para formar um fon positivo e uma ligação iônica, como no fluo- 


reto de lítio. 
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Vemos assim que o princípio de exclusão desempenha um papel fundamental 
na explicação das propriedades químicas dos elementos , e o mesmo valc para a 
explicação de tabela periódica de Mendeleev. 

O princípio de exclusão também é essencial para explicar a estabilidade da 
matéria. Se não fosse pelo princípio de exclusão, nada impediria que vários átomos 
de H, em lugar de formar moléculas, juntassem todos os prótons de seus núclcos, 
com uma única nuvem de muitos elétrons em torno deles, formando uma configu- 
tação mais estável, pelo aumento da atração coulombiana. Em lugar disso, podemos 


ter no máximo dois elétrons, de spins opostos, funcionando como “cola” para ligar 
dois prótons: é a molécula de Hz , e a base da ligação química covalente. 

É ainda o princípio de exclusão que atua na explicação do ferromagnetismo, o 
alinhamento dos spins e momentos magnéticos, em materiais como o ferro, que é a 


origem dos ímãs permanentes. 


10.7 Movimento de elétrons em cristais 


Uma das aplicações mais importantes da mecânica quântica ao estudo da es- 
wutura da matéria é a física da matéria condensada (ou física de estado sólido), 
uma das áreas mais ativas da física atual. Para ilustrar alguns conceitos básicos da 


áre 


„ vamos considerar, num modelo altamente simplificado, o espectro de energia 


associado ao movimento de um elétron num “cristal unidimensional”. 


Um cristal, como vimos ao discutir a di- 
fração de raios X , é uma rede periódica 


o áto- 


tridimensional, cujos elementos s 
mos ou grupamentos atômicos. O metal 
p. ex., que é o Li, 
cristaliza formando uma rede cúbica cen- 


alcalino mais simples 


trada, conforme ilustrado na fig: 10.18, 


Fig. 10.18 Rede cúbica centrada onde cada átomo tem 8 vizinhos. 


Como vimos, cada átomo de Li tem um elétron mais fracamente ligado (na camada 
mais externa). Como cada átomo está ligado a 8 vizinhos, e cada ligação une 2 áto- 


covalente, como a da molécula de H2, é 


mos, há 4 ligações por átomo. Uma liga 


formada por 2 elétrons de spins opostos. Como só há um elétron externo por 
átomo, há apenas 1/8 da carga necessária para uma ligação covalente, tornando 
muito fácil que o elétron da camada mais externa migre de um átomo para outro. 
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Assim, o que é característico de um metal é que existem elétrons quase livres 
para deslocar-se através da rede cristalina. Essa grande mobilidade dos elétrons é 
uma das principais razões porque os metais são bons condutores de eletricidade; 
ainda antes da mecânica quântica foi formulada a teoria dos elétrons livres para 
explicar a condutividade de um metal. 

Para ter uma idéia do fipo de especiro de energia de um elétron num cristal, 
vamos considerar um modelo unidimensional da rede periódica, representado na 


fig. 10.19. 


avo 
i 


b 


b je je a> 


Fig. 10.19 Rede periódica unidimensional 


O potencial V(x) associado à rede, que é sentido por um elétron, é uma série 
de poços retangulares atrativos, de profundidade U e largura b (representando os 


“fons” ),” com período espacial 


i=a+b| (10.127) 


O teorema de Bloch 


O hamiltoniano associado ao movimento do elétron na rede é 


(10.128) 


* O potencial V (x) representa o efeito de todas as partículas do cristal, exceto o elétron considerado. 
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Um cristal macroscópico é formado por um grande número de átomos. Despre- 
zando efeitos de superfície, vamos inicialmente supô-lo infinito; neste modelo unidi- 
mensional, isto equivale a dizer que V(x) é uma função periódica em toda a reta: 


Ive +D=vG) (œ<xr<%) (10.129) 


o que implica 


A(x+i)= v 


(10.130) 


Vamos definir o operador de translação F aplicado u uma função f(x) por 
CORREDI (10.131) 
Seja p (x) um estado estacionário de È com energia E: 
ÊQ) (x)= Eo(r) (10.132) 
Pela (10.131 aplicada à função È (x)f(x), temos 
$ HOON iG +Dr(+D)= Et) ke +1) 
=H FE). YS 


ou seja 


comutador 


so. v 16) 


o que implica 


A à (o)- oj (10.133) 


Mas, pelo que vimos na Seg. 8.10, esta é uma condição necessária e suficiente 
para que os operadores J e H(x) tenham um conjunto completo de autofunções 


em comum. 
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Logo. os estados estacionários (10.132) podem ser escolhidos como autofun- 
ções de T: 


[feae 


P À = autoval 10.134; 
| 206)- E96) autovalor ( ) 


onde À não precisa ser real (5 não é um observável). 
Pela definição de F, isto dá 


ele: D)=-A06)| (va) (10.135) 
Mas, pela condição de normalização, devemos ter 


1= JloG+Df az= 


E — = pe 
(+= x) 0 =Ipefer e 
o que dá 
PÉ (10.136) 
permitindo portanto escrever ). como um fator de fase: 
[À (10.137) 
onde k é real e é definido por esta relação e pela (10.135). 
Definindo u (x) por 
etc C) | (10.138) 


) e (10.137) dão 
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oeth Our D= e“ pE) Our) 


| (10.139) 


As (10.138) e (10.139) constituem um caso particular, unidimensional, do teo- 
rema de Bloch. Elas mostram que os estados estacionários do elétron num potencial 
periódico (~œ < x < œ) têm a forma de ondas de comprimento de onda 
A = 27/k (k real) e de amplitude i (x) periódica, ou seja, podendo variar dentro 
de uma unidade da rede (sítio). mas a mesma em cada sítio. 

Assim, o elétron fica “livre” no sentido de estar deslocalizado: há a mesma 
probabilidade de ser encontrado no entorno de cada um dos sítios. A relação 
Q(x + 1) = fg (x) mostra ainda que k | representa a defasagem entre duas uni- 
dades vizinhas da rede. 


Solução do problema de contorno 


AVG) Basta agora considerar o problema dentro 
-b o a abs m de um período (fig. 10.20). 
Tomando 
E 2 | 
| B= grey | 
| 2m 
10> g> -U | 
ü FRA | 
pe E E+U-Ż R>o0| 
2m | 
Fig. 10.20 Nível de energia num período da rede (10.140) 


obtemos, como na (10.77). as soluções 


QEA B (b< a< 0)] 


g (10.141) 
=C +D" (0<x<a)| 
que, pelas (10.138), correspondem a 
ls Tok) TRA < I 
lu (x)= Ae +Be -b < x< 0) 
a ( J| (10.142) 


MOEL E peč" (0<x<a) | 
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onde m(x) é periódica de período Í. 

As funções p e dp/dx têm de ser contínuas nos pontos de descontinuidade; 
logo, o mesmo vale para u (x). Devido à periodicidade de u (x), basta aplicar as 
condições de contorno em x = 0 ex = aq; isto implica que permanecem válidas em 
=t katkat 


Em x = 0, obtemos: 


A+B=CA+4D 
(10.143) 


i(k — k)A - i (ky + k)B = (K - ik)C - (K +ik)D 


Para aplicar as condições em x = æ, notamos que, pela periodicidade, a solução à 
direita de a é 


-b<x<0 
u()= we- = 406 D6D + BACO gaa 
(e<x<a+b=1) 
o que, juntamente com a segunda (10.142), dá, em + = a, coma — I = ~b, 


A 4 pol ca, Doida 
o kA il, + BED = (e -ik)C e, (10.145) 
-k+ ppor De 


Multiplicando ambos os membros por e e com as notações 


(10.146) 
obtemos 
( efg A+uB)-EC+ID 
4 a (10.147) 
pesl(o- aa A- frt k |z s|- (K-ik)gc — Erig D 
| já X 
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As (10.143) e (10.147) são um sistema homogêneo de 4 equações lineares nas 
4 incógnitas 4, B, C, D. Para que haja solução não-trivial, o determinante do sis- 
tema tem de anular-se, o que dá a condição de autovalores. 
Após um cálculo bastante trabalhoso, resulta a condição 
l=a+b 


| F(E)= E) sh (K a)sen (ky b) + ch (K a)cos(k; b) = cos (k1) | (10.148) 
i q a 


Como acontece nos problemas tratados anteriormente, o resultado permanece 
válido quando a energia E é > 0, E = W /2m x°, com x real, bastando fazer a 
substituição [cf. (10.140), (10.141)] K — ix na (10.148). 

Pelas (10.140). ko e K se exprimem em função da energia E, de forma que o 
1.º membro da (10.148) é uma função F(E). No 2.º membro, k é um parâmetro tal 
que [cf. (10.135) e (10.137)] 


loe +1) ES) (10.149) 


correspondendo à variação de fase da função de onda entre sítios vizinhos. 


Fig. 10.21 Bandas de energia permitidas 


A fig. 10.21 mostra o gráfico de F(E) para valores típicos dos parâmetros. 
Como o domínio de variação de cos(kl) está entre —1 e +1, só existem soluções 
da equação de autovalores (10.148) dentro desse domínio. Vemos na figura que 
isso só acontece dentro de uma série de faixas desconexas da energia E. 
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Obtemos assim um resultado fundamental: o espectro de energia associado a 
um cristal unidimensional é um espectro de bandas, separadas por lacunas “proibi- 
das”, onde não há níveis de energia. (Dentro de cada banda. nesse modelo em que 
o “cristal” é infinito, a energia varia continuamente). Essa é uma propriedade geral 
da propagação de ondas em estruturas periódicas, válida também, p. ex., para 
filtros elétricos (ondas de voltagem ou corrente). como vimos (Fís. Bás. 3, Seç. 
10.9). 

Para cnergias E < 0, que corresponderiam a estados ligados discretos nos po- 
ços de potencial individuais, as bandas são estreitas: os níveis de energia mais 
profundos em cada poço, correspondentes aos elétrons mais fortemente ligados aos 
sítios da rede, são os menos afetados pela presença dos outros sítios. 


A estrutura de bandas persiste para E > 0, acima dos topos dos poços de pu- 
tencial, mas as lacunas ficam cada vez mais estreitas à medida que E cresce. 


Número de níveis numa banda 


Até agora, tratamos do “cristal unidimensional” como se fosse infinito. Na 
realidade, um cristal macroscópico tem tantos átomos que os efeitos de superfície, 
associados às condições de contorno na superfície do cristal, são praticamente des- 
prezíveis, ou seja, quase não influem nas propriedades volumétricas do material. 

Podemos então escolher condições de contorno que minimizam os efeitos da 
superfície. As mais simples são condições de contorno periódicas: para uma cadeia 
linear de N átomos, com x = 0 e x = N I nos extremos, elas correspondem a impor 


K ()=o(v)| N I= “comprimento do cristal” = L (10.150) 


ou seja, pela (10.138), 


u(O)= i nN df [d =] EA 
A A 


\ i 
iguais pela (10.139) 
o que dá autovalores discretos para k; 


Es 


(10.152) 
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Como a condição para os autovalores de E só depende de kl ,¿ os níveis de 
energia não se alteram pela substituição 


2 
to tap 


(10.153) 


de modo que, para obter todos os níveis, basta confinar k a um intervalo de com- 
primento 27/!, tal como 


epa, (10.154) 
| 


Esse intervalo é varrido quando, na (10.152), n varre exatamente N valores 
inteiros sucessivos. Logo, existem. N níveis em cada banda, N sendo o número 
total de átomos do cristal (neste modelo, em que há | átomo por sítio) 

A razão de ser desse resultado é que a banda se origina de um nível ligado de 
um único poço, mas o clétron correspondente pode estar em qualquer um dos N 
poços, o que leva a N situações possíveis 

Como F(E) na (10.148) só depende de k através de cos(k!), as soluções 
para E são funções pares de k . Pela fig. 10.21, as extremidades das bandas de 
energia correspondem a [cf. (10.154)] 


cos (ki) = +1 [ k=0.+5 


(10.155) 


Logo, curvas típicas de E em função 
de k (para E < 0) têm a forma indi- 
ERA E y ea cada na fig. 10.22. 


Qual é a origem física da formação de 
lacunas para k = + 7/12 A (10.138) 
mostra que k desempenha um papel a- 
nálogo ao do número de onda da onda 


E] 


| 
ii 
| 


eletrônica no cristal, ou seja, 
Fig. 10.22 Energia como função de k 


nz Lkl=mnemi=2 (10.156) 


que é a condição para reflexão de Bragg da onda eletrônica nos sítios do cristal 
unidimensional (“incidência” 1. dsenð = d = 1). 
Para k = + n/l , as soluções estacionárias não são as ondas e (/2* mas 


ondas estacionárias obtidas superpondo uma onda incidente com sua reflexão de 


Bragg, 


1 
N 
8 
& 

PT 

~|? 

$ 

Ga 


(10.157) 


1 
N 
= 
4 
5 

1 

a | a 
* 
Saio 


Como Iq= (x) Pé a densidade de proba- 
x bilidade eletrônica, vemos que, para q. 


ela é máxima onde o potencial é mais 
atrativo (x = O ); para q, é nula 
nesses pontos e máxima (fig. 10.23) onde 
V(x) = 0. Essa é a origem da lacuna de 
energia, c vemos que cla deve ser da or- 
dem de grandeza da profundidade do 
poço associado a cada sítio. 


Fig. 10.23 Origem da lacuna de energia 


Aplicação: metais, isolantes e semicondutores 


Os elétrons que estivemos discutindo são aqueles mais fracamente ligados aos 
átomos, chamados de elétrons de valência (que também são responsáveis pelas li- 
gações químicas: daí o nome). Para o Li, há um elétron de valência por átomo, ou 
seja, N elétrons. 

Vimos também que N é o número de níveis de energia em cada banda, no 
modelo simples em que há um só átomo em cada célula unitária do cristal. Pelo 
princípio de exclusão, segue-se que cada nível comporta 2 elétrons de spins opos- 
tos, ou seja, 2N elétrons por banda. 


Banca 
semi-cheia 


EIS 


Fig. 10.24 Bandas para um metal 


Os átomos dos metais nobres (cobre, prata, 
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No caso do Li, só há N elétrons dispo- 
níveis (1 por átomo), de modo que a ban- 
da fica semi-cheia (fig. 10.24): é muito 
fácil então um elétron ser excitado a ní- 
veis vizinhos não-ocupados. Em particu- 
lar, isso acontece quando se aplica um 
campo elétrico: o material é condutor. 
Isso vale para todos os cristais de metais 
alcalinos, como Li, Na, K, Rb: são subs- 
fâncias metálicas 


) também têm um número impur 


de elétrons de valência e um átomo em cada célula unitária. Logo. também terão 
uma banda semi-cheia, o que é responsável pelas suas propriedades metálicas e 


condutividade elevada, 


Fig. 10.25 Bandas para um isolante 


Elementos com um número par de elé- 
trons de valência, como o enxofre (que 
tem 4) podem satisfazer o princípio de 
Pauli preenchendo totalmente os níveis 
de uma banda (fig. 10.25). Nesse caso, 
para que possam ser excitados elétrons à 
banda superior vazia, é necessário forne- 
cer-lhes uma energia igual à lacuna A, 
que no enxofre é de 2,4 eV. 

Como a energia térmica média à tempera- 
tura ambiente é - 0,025 cV, o fator de 
Boltzmann exp(-A/KT) torna 
desprezível 


probabilidade de 
transposição da lacuna; não é possível 
criar uma corrente elétrica com campos 
elétricos normais aplicados: o material é 
isolante. 


Por outro lado, fótons na região azul do espectro têm energia suficiente para 


excitar elétrons através da lacuna, sendo portanto absorvidos: daí a coloração ama- 


rela de um cristal de enxofre. 
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Num semicondutor puro (intrínseco), à 
lacuna A entre a última banda total- 
mente preenchida (banda de valência) e 
EE a primeira vazia acima dela (banda de 
i condução) é muito menor (fig. 10.26), 
tipicamente da ordem de 0,5 eV. 


À temperatura T = 0, o material 
seria isolante. Entretanto, à temperatu- 
ra ambiente, já há uma fração dos elé- 


= trons termicamente excitada do topo 
da banda de valência para o fundo da 
t banda de conduçao: o material tem 
uma condutividade G à temperatura 


Fig. 10.26 Bandas para um semicondutor intrínseco ambiente tipicamente ~ 101º vezes mai- 


or que a de um isolante, embora ainda muitas ordens de grandeza menor que a de 
um metal. 

Têm grande importância em microeleirônica os semicondutores dopados, que 
contêm concentrações pequenas c controladas de átomos de impurezas, quebrando 
a regularidade da rede cristalina. A presença de impurezas afeta os níveis de ener- 
gia e fornece novos portadores de corrente. Isso é aplicado nos transistores. 


70.8 A interpretação da mecânica quântica 


Alguns dos aspectos mais peculiares da física quântica surgem quando se con- 


sideram estados correlacionados de 2 partículas. 

Vamos exemplificá-los voltando ao exemplo da polarização de fótons. Vamos 
considerar um sistema de 2 fótons que se propagam na mesma direção z, embora 
não necessariamente no mesmo sentido (vamos aplicar os resultados a fótons em 
sentidos opostos). 


Na representação em que o vetor de estado de polarização linear na direção 6 
é (cose 


po | umã base-é Fóriniáda pelos vetores dersstado 
E 


J 


(10.158) 
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que representam fótons linearmente polarizados nas direções x e y, respectivamente. 

Para descrever o sistema de 2 fótons, é preciso ter vetores coluna de 4 compo- 
nentes, pois temos de representar amplitudes de probabilidade para que, com anali- 
sadores orientados nas direções x e y, respectivamente, cada um dos 2 fótons seja 
encontrado com cada uma dessas polarizações (4 possibilidades). 


Uma base conveniente se obtém usando o produto direto dos vetores da base 
(10.158). O produto direto de 2 vetores coluna é definido por 


(10.159) 


1 Amplitude de probabilidade de achar 

x4) x(2) = l g I - g ¿— O fóton 1 linearmente polarizado na 
0 0 
0 


direção x e o fóton 2 também 


Analogamente, obtemos os demais. A base é então 


[o 1 o 
EDEORNEEDHO RI 
lasa |) mom |8 
BE en ST 

| 0 » lo 

| (10.160) 
| 0 0 | 
| 0 0|| 
20x0)= 30»0)-||| 
a Ss [gji 
Ñ, et, 0 I elh 1). 


e o vetor de estado geral de polarização para 2 fótons é 
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| [ves | 
pei “Ev OO ns DO ur C) Mal 
L 


(10.161) 


onde, p/ ex., Y,- é a amplitude de probabilidade de achar o fóton | linearmente 


polariz 


do na direção y e 2 na direção x. 


Consideremos agora o estado (normalizado) 


Dex) + 0 ol- z z s (10.162) 


J2 L 


que se chama emaranhado, porque não pode ser decomposto num produto de um 
estado do fóton 1 por um estado do fóton 2. Pela interpretação física vista na 
(10.161), esse é um estado em que há probabilidade 1/2 de achar ambos os fótons 
polarizados na direção x e probabilidade 1/2 de achar ambos polarizados na direção 
y, ou seja, em que as polarizações lineares dos dois fótons estão correlacionadas: 
ambas têm a mesma direção (x ou y). 

Assim, se (usando um analisador) verificamos que o fóton 1 tem polarização y, 


podemos afirmar, com certeza, que o fóton 2 também tem a mesma polarização y. 


Consideremos agora (fig. 10.27) outro 
par de eixos (x y’) no plano (xy), onde 
x’ faz com x um ângulo 6. Se tomarmos 
novos vetores de base nas direções x” e 
y’, teremos 


o 


Fig. 10.27 Rotação de eixos 
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| 
| (10.163) 
| 


e podemos definir o estado 


[199 = F [* Ore) yuy o) (10.164) 


d 1 |fcos8 cos 6 —sen 6 —sen Q 
|s} = — E + Q 
V2 |\sen 0, R sen 0), cosB ), cos0 j, 


cos? 8 ( sen? 6 cos? 0 + sen? 0 1 
1 || cosBsen6| || -sen 0 cos 8 1 0 E i 
TA | sen8cos8 |” | -cosBsen 8 =E 0 A20 
sen? 0 | cos? 6 sen? 0 + cos” O 1 
| 
|s) (10.165) 


ou seja 


|$= zl 0 0H] = Lo y +" 00) | (10.166) 


Assim, no estado S, as polarizações lineares dos dois fótons são paralelas, 
qualquer que seja a direção O escolhida. 


O paradoxo EPR 


Consideremos um átomo num estado excitado que, numa transição para outro 
estado, emite 2 fótons em direções opostas, no estado de polarização IS} (veremos 
logo um exemplo concreto). 
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Fig. 10.28 O paradoxo EPR 


Nesse caso, se tivermos (fig. 10.28) dois analisadores de polarização, de um 
lado e do outro do átomo, com seus eixos paralelos à direção x, e se o fóton 1 
passa pelo seu analisador, ou seja, é linearmente polarizado na direção x, podemos 
garantir que o fóton 2 também será linearmente polarizado na mesma direção x. 

Como os analisadores 1 e 2 podem estar tão distantes um do outro quanto 
quisermos, tenderíamos a achar que a determinação da polarização do fóton 1, sem 
perturbar em nada a polarização do fóton 2, permite-nos predizê-la. Segundo A. 
Einstein, B. Podolski e N. Rosen [Phys. Rev. 47, 777 (1935)], deveríamos poder 
dizer então que o fóton 2 tem uma polarização linear bem definida na direção x. 

Mas vimos na (10.166) que o mesmo se aplica a qualquer outra direção x", 
que forma um Z 9 arbitrário com x, p. ex., 6 = 7/4: o fóton 2 teria então também 
uma polarização linear bem definida nesta outra direção. 

Por outro lado, vimos na Seç. 8.10 [cf. (8.122)] que polarizações lineares em 
direções diferentes (não perpendiculares) são observáveis incompaiíveis: um fóton 
não pode ter simultaneamente valores bem definidos para elas. Embora formulado 
originalmente de forma diferente, esse é o paradoxo EPR, e a conclusão desses 
autores foi que a mecânica quântica seria uma teoria incompleta, pois não permite 
representar estados em que coexistem valores bem definidos da polarização linear 
em diferentes direções, embora seja possível predize-lus “sem perturbação”. 

David Bohm, em 1952, formulou uma “interpretação causal” da mecânica 
quântica, admitindo a existência de “variáveis ocultas”, que teriam valores bem 
definidos (como, no exemplo acima, polarizações lineares em diferentes direções), 
mas sobre as quais a teoria quântica só daria informações incompletas. Como se 
poderia testar então a existência dessas variáveis? 

Em 1965, John S. Bell mostrou que haveria testes experimentais realizáveis 
(em princípio) para esse fim. Numa experiência do tipo acima, orientando os anal- 
isadores em 3 direções diferentes, formando ângulos de 120º entre si, e medindo 
probabilidades de que os 2 fótons passem pelos respectivos analisadores quando 
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formam um determinado ângulo, é possível mostrar que, para uma combinação o 
tem definida dessas probabilidades, qualquer teoria local (sem ações à distância) 
de variáveis ocultas leva a uma desigualdade (desigualdade de Bell) que, neste ca- 
so, é da forma 


MLET | (10.167) 
ao passo que a mecânica quântica leva a 


lohe S 


| (10.168) 


permitindo, portanto, violar a (10.167). 

Um experimento crucial foi realizado em 1982 por A. Aspect, P. Grangier e 
G. Roger [Phys. Rev. Lett. 49, 91 (1982)]. Eles utilizaram pares de fótons emitidos 
numa transição no “Ca , em que o par é produzido no estado | S} . Para os ângulos 
que empregaram, a previsão da mecânica quântica era [violando a (10.167)] 


Oga = 270 
e o resultado experimental foi 


Sap = 2,697 + 0,015 


violando claramente a desigualdade de Bell (10.167). 

Num experimento posterior [A. Aspect, J. Dalibard, G. Roger, Phys. Rev. Lett. 
49, 1804 (1982)], as orientações dos analisadores de polarização dos fótons 1 e 2 
eram alteradas aproximadamente ao acaso, a intervalos de 10 ns , com os dete- 
tores separados por uma distância L de 12 m, o que dá L/c ~ 40 ns . Logo, ne- 
nhum sinal podia ser transmitido de um detetor para o outro durante o tempo de 
vôo dos fótons. Apesar disso, as correlações e a violação da desigualdade de Bell 


aj + 
persistiram! 


* Em 1997, N. Gisin ef al. observaram as correlações para fótons separados por distâncias da ordem de 10 
km! 


412 


y 


Nesse sentido, portanto, as correlações são não-locais, e uma teoria de variá- 
veis ocultas teria de ter ações instantâneas à distância para ser compatível com 
elas, o que, para Einstein, não seria uma solução satisfatória, pois, em suas pala- 
vras: “Só se pode achar uma escapatória supondo que a medida de 1 (telepati- 
camente) altera a situação real de 2 ou negando situações reais independentes a 
objetos separados por um intervalo do gênero espaço. Ambas as alternativas me 
parecem inteiramente inaceitáveis”. 

Embora as correlações EPR sejam não-locais, não violam o princípio relativís- 
tico de que nenhum sinal pode propagar-se com velocidade > c (Seç. 6.6). Com 
efeito, para observar as correlações entre os detetores 1 e 2, é preciso comparar as 
observações feitas. e para isto é preciso, independentemente, transmitir um sinal 
(por exemplo. eletromagnético) entre 1 e 2 contendo esta informação. 

O efeito EPR tem uma aplicação prática na criptografia, onde se quer trans- 
mitir uma mensagem cifrada de um ponto 1 para outro ponto 2, de tal forma que 
a “chave” usada para decifrar a mensagem não possa ser interceptada e decodi- 
ficada. 

A chave, que é uma segiência ao acaso de bits (O ou 1), tem de ser transmi- 
tida entre os 2 pontos “à prova de intercepção”. Os resultados de uma experiência 
EPR, onde 0 e 1 podem, por exemplo, corresponder às polarizações lineares xey, 
satisfazem a esta condição justamente porque não transmitem nenhum sinal, repre- 
sentando puro acaso. A informação está contida na correlação entre os resultados 
observados em 1 e 2. Esse método de criptografia quântica já está sendo empre- 
gado [A. K. Ekert, Phys. Rev. Lett. 67, 661 (1991). 


Descoerência 


Consideremos um fóton que incide sobre 
uma lâmina transparente (fig. 10.29), de 
tal forma que a refletividade e a transmis- 
sividade sejam iguais (ambas 50%). 
Quanticamente, o vetor de estado resul- 
tante é uma superposição coerente de 
11) (fóton no feixe refletido) e 
12) (fóton no feixe transmitido). como. 


Fig. 10.29 Divisão de feixe p.ex. ( 1/92) (11) + 12)). 
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Um tal estado é muito diferente de uma “mistura estatística”, em que o fóton 
estaria com igual probabilidade em |i} ou em 12), sem que saibamos onde se 
encontra. 


Com efeito, na superposição quântica coerente. é possível, usando um disposi- 


tivo do tipo de um interferômetro de Michelson, voltar a reunir os feixes 1 e 2 e 
observar interferência entre dois caminhos possíveis. Nesse sentido, podemos dizer 
que o fóton está ao mesmo tempo nos feixes 1 e 2, evoluindo pela equação de 
Schrödinger. 

Isso pode não ser muito surpreendente para um objeto microscópico, como o 
fóton. Mas, se a mecânica quântica e o princípio de superposição também se apli- 
cam a objetos macroscópicos, conforme acreditamos, por que razão eles não apare- 
cem em superposições coerentes de estados macroscopicamente distintos? 

Esse aparente paradoxo foi formulado em 1935 por Schrödinger, nos seguintes 
termos: 

“Um gato está encerrado numa câmara de aço, juntamente com o seguinte me- 
canismo diabólico (inacessível ao gato); dentro de um contador Geiger, há uma 
pequena quantidade de material radioativo, tão pequena que no decurso de uma 
hora talvez um único átomo se desintegre, mas com igual probabilidade de que isto 
não aconteça. Se acontecer, o contador, através de um relé, ativa um martelo, que 
quebra um frasco de ácido prússico. Deixando o sistema isolado durante uma hora, 
resulta que o gato estará vivo caso nenhum átomo se desintegre ao longo deste 
período, mas que uma única desintegração basta para envenená-lo. A função de 
onda do sistema todo representa essa situação como uma superposição do gato vivo 
e do gato morto em partes iguais” 

A superposição quântica coerente, nesse caso como no exemplo acima, do 


fóton, difere de uma distribuição estatística, em que as probabilidades dos dois 


estados seriam iguais, pela possibilidade, em princípio, de observar interferências 


entre eles. 
Recentemente houve progressos importantes na elucidação desse problema. As 


variáveis empregadas na descrição de um sistema macro 


scópico constituem apenas 
uma fração diminuta do conjunto total de variáveis (microscópicas) que seriam ne- 
cessái 


para caracterizar completamente o seu estado quântico. Todas as demais 
variáveis não são observadas, O que representa uma perda de informação. 

Esse é um processo comparável ao que ocorre na dissipação de energia macros- 
cópica por afrito, em que energia mecânica é convertida em calor por transferência 
a graus de liberdade internos. 
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Para que um sistema seja observado, é preciso que ele seja aberto, ou seja, que 
interaja com o ambiente que o rodeia (o “resto do Universo”). Esse ambiente não é 
observado, e a informação que recebe do sistema macroscópico é assim perdida. 
Note a referência a “deixar o sistema isolado” no trecho acima de Schrôdinger. 

Pode-se mostrar [cf. W. H. Zurek, Phys. Today 44, 36 (1991)] que esse “atrito 
” é o processo responsável pela perda da coerência quântica na es- 
cala macroscópica. Ele é chamado de descoerência, e ocorre numa escala de tempo 
muitas ordens de grandeza menor do que os tempos usualmente observáveis, pas- 
sando assim despercebido. O tempo de descoerência é inversamente proporcional 


da informaçã 


ao “grau de macroscopicidade” do sistema. 

Entretanto, tomando precauções especiais para reduzir a interação com o am- 
biente, foi possível, recentemente. observar v efeito e medir o tempo de descuerên- 
cia num sistema de alguns fótons contido dentro de uma cavidade ressonante a 
baixas temperaturas [M. Brune et al., Phys. Rev. Lett. 77, 4887 (1996); veja tam- 
bém S. Haroche et al., La Recherche 301, 50 (setembro de 1997)1. 

A interação com o ambiente parece ser responsável, ao menos em parte, pelo 
caráter probabilístico da teoria quântica, o aspecto “Deus joga dados” que tanto 
desagradava a Einstein. Seria o preço a pagar pelo “pecado original” de estudar um 
sistema de forma isolada, fazendo abstração de sua interação com o resto do Uni- 


verso, que é uma das bases do método científico (Fís. Bás. 1, Seç. 1.3). 
É um grande mérito — e não um defeito — da teoria quântica ter atingido a 
fronteira onde se torna aparente o efeito dessa interação sobre o mundo físico. 


PROBLEMA. 


1. No problema do degrau de potencial (Seç. 10.2), mostre que não podem 
existir estados estacionários com E < 0. 

Sugestão: Escreva as soluções nas regiões 1 e 2 e mostre que não é possível 
satisfazer as condições de contorno em x = 0. 


2. No problema da barreira retangular (Seç. 10.4), calcule a amplitude de re- 
flexão R = B/A e a probabilidade de reflexão R. Mostre que R + F = 1. 
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v 3. Uma partícula de massa m está 
confinada, em uma dimensão, por um 
poço de potencial retangular, limitado à 
esquerda por uma barreira impenetrável 
(fig.), correspondendo ao potencial 


fo) ERE a x 
Î Ve- s0) 
y =V(0<x<a), 
=0(r>a). 
onde V > 0. 
(a) Para -V < E = —1E|l , escreva as soluções estacionárias de energia E da 


equação de Schrödinger dentro e fora do poço de potencial. 
(b) Aplicando as condições de contorno, demonstre que os autovalores da 


energia são as raízes da equação 


tg Ea o = EE 


| el | 


4. Demonstre que o valor esperado da distância do elétron ao núcleo no estado 
fundamental do átomo de hidrogênio é (1) = iam. 


5. Calcule os valores esperados da energia cinética (T) e da energia potencial 
(V) no estado fundamental do átomo de hidrogênio e verifique que satisfazem ao 
teorema do virial: (V) = —2(T). 

Sugestão: Use a (10.112). 


6. Um elétron está confinado dentro de uma camada delgada num semicon- 
dutor. Tratando-a como uma lâmina de espessura a entre paredes impenetráveis [cf. 
(10.35)], estime a, sabendo que a diferença de energia entre o estado fundamental 
e o primeiro estado excitado é de 0,05 eV. 


7. Um feixe de elétrons de 2 eV incide sobre uma barreira de potencial retan- 
gular de 4 eV de altura e 10 Á de espessura. Qual é a probabilidade de trans- 


missão? Qual seria para elétrons de 3 eV? 
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8. Uma partícula se encontra confinada numa caixa com paredes impenetráveis 
de largura a. em uma dimensão. Para 1 = 0, ela se encontra 


com certeza, na metade 
direita da caixa, havendo igual probabilidade de ser encontrada em qualquer ponto 
dessa metade. 


(a) Obtenha uma função de onda inicial que descreva a partícula. 


(b) Qual é a probabilidade de que uma medida da energia, para í = 0, encon- 
tre-a no estado fundamental? 


Sugestão: aplique a Regra II. 


9. A solução mais simples, com nodos, da equação de Schrúdinger para auto- 
estados s do átomo de H leg. (10.116)] é da forma 


| o6) = (ar + B)exp (x7) | 


Procure uma solução dessa forma. Mostre que o nível de energia correspondente 
(estado 2s) é idêntico ao 1.º estado excitado na teoria de Bohr. 


417 


RESPOSTAS DOS PROBLEMAS 


CAPÍTULO 2 


1. (a) tg0 = mo ; (b) 0 = 53º (ar/água) ; Oy = 56,7 (ar/vidro). 


Y 
N 
D 


3. (n — 1) para n par; n para n ímpar (exceto para uma fonte situada na bissetriz, 
quando são n — 1). 


4. (a) 87,5 cm ; (b) 80 cm. 


j , 
à demad lo tetb 
Vl-nº sen? 8; 
8. (c) 137,5º 
9. Ona = arcsen £ n -l ) 
15. 1,14 em 


17. (a) R=4d//3=333em ; (b) p= dı/3 = 8,3cm 


f : q=-@A-1)f, onde sinais superiores e inferiores 


se correspondem. 


19. (a) f=- Im ; (b) f= + 6,27m. A lente passa de divergente a conver- 
gente: a classificação se inverte para índice de refração relativo < 1. 
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20. q= Rijl+ 
na aproximação paraxial, tende a f’ = (= 12 a 
p 
Ba “SC ii 
2 io 


23. m,n Com), ( 


X 
=] 
x 


| entro + no) - (mo) 


26. x = 


mo (1+ Bo) 
2.n=2 
28. ()p=2f : Dm=-1 
CAPÍTULO 3 
AD 
É. Pag 
A 

dom 

PA (e=1) 


4. 88x10%rad 
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son Lo 56) p=YmAR (m=0,1,2,..) 


2R 
A) 5 Saky 
t ET TOS à Mo 
CAPÍTULO 4 


2. À = 6006Ã 
5. 113km = 6,5% do raio da Lua. 
6. (a) Da ordem de 100 m. (b) 9,8 x 10*rad ~ 0,02” 


10. (a) 55.000 ; (b) 0=31,6º ; 80=5,6x 10%rad 


ADA sfn saj 2 


G E) 


12. (a) 


13. 85 


CAPÍTULO 5 


Uu Up =U; 


5. (a) Circular levógira, amplitude 2a ; (b) Elíptica dextrógira, eixos 3a e a. 


6. (0) d=1r 7n —m) : (b) circular ; (c) d = 0,027 mm 

4 é) 
7. Em ambos os casos, a intensidade não varia com a rotação do analisador ; (b) 
Para luz natural, continua não havendo variação ; para polarização circular, a inten- 
sidade transmitida varia e se anula para duas orientações (opostas) do analisador. 


8 I= n cos?6 sen"9 


9. Ân (DE — K, E,) = 0 / & 


2 vus6, sen O; 2cos6, senB, 


10. An, +6,) 1a +6,)cosf, 87) 
2 
L=n= @=0) 
i a= sen (2 0,) sen (28,) ga sen (26,) sen (26,) 


+T gen? 8, +8,) sen? (8, +0,) cos (6, 05) ` 


4 
ie (1 =0) 


(r+1) 


CAPÍTULO 6 
6. (9) x =y B) ; x» a =a ; mw =y(xw-Bm) 
9. 1g6=71g% 


10. É de 216 milhões de reais 


16. 


Ts 


19. 


Respostas - Cap.6 421 


. (a) 533 ; (b) 99,9998% 


web-a ea 


- (b) 2,23 T 


2 ip 


d Re dia 
@ Q= tE) cm lm i ONO > ct 
a 


(O M= 2ta) m :0) V=av/fi+o) 


; i 
(a) tg = Tr ; b) Z= L (1 Es e) cos? 6! + sen? e] : pe 


ols 
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CAPÍTULO 7 


1. (a) 300m ; (b) 41x 10°eV ; (e) 75x 10% 


2.(a) 42eV ; (b) 41eV 


3. 17,6 MeV 
à ipen sen 6 

b, HER Vo — V cosĝ® 
5. 32,5 eV 


7. (b) 6.403Å 
9. (b) 0,027% 


10. E =nho ; freqüência q 
Fe 


iL E =r 
a) E, Mr 


; (b) & = 7,6 x 10° eV 


12. (a) 1,242 x 10™em (b) 1,5Å 


4 
1M. (@) E, = -2—2  (0=1,2,.)5(b) E = 54,46V 
(am) nº E) 1º 
CAPÍTULO 8 
1 “fo 
Za + = 0) l-) k uj- Nesta representação, os vetores de estado de 


polarização circular direita e esquerda são os vetores de base. 


7. (a) p = co 0 cos (6-6): b) 0, = 


8. (b) 8 = — 77/4. 


o E 3 | so — sen (26) cos (26) 
E RR nt cos (28) sen (20) 


CAPÍTULO 9 


lo é ə 
2. [é z] A 


5. p=] +EP +2Re (Cc, e) =p) 


s=(ef- ef) ¢=p/m) 


CAPÍTULO 10 


z efe Aa g r CO. 
à “nad Rs | P +4 rsení(ka) 


423 


424 


6. a=48x10?m 


7. 2eV:2,04x10º ; 3eV:1,07 x10* 


e 


9-16-20)e»(-;) 
24 
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